Desenvolvimento de um classificador a partir de um conjunto de dados de sinais biológicos, almejando categorizar os dados entre fumantes e não fumantes a partir de algoritmos de Machine Learning.
O trabalho foi desenvolvido em conjunto para a disciplina de Introdução à Ciência de Dados - SME0828, ministrada pelo professor Francisco Rodrigues em 2023 no ICMC - USP São Carlos. A autoria é de Artur De Vlieger Lima, João Pedro Soares de Azevedo Calixto e Vicenzo D'Arezzo Zilio.
O notebook está dividido em:
- Visualização de dados
- Análise estatística
- Transformação de dados e feature engineering
- Teste de Modelos
- Ajustes dos dados
- Predição
- Conclusões e Comparações
Os dados são oriundos do Kaggle, disponível em: redirecionamento à página