Neste repositório se encontra o projeto final da terceira edição da imersão dados, uma semana com aulas todos dias desenvolvidas pela Alura, a maior plataforma brasileira de cursos de tecnologia. Esse projeto foi desenvolvido em python e teve como objetivo aplicar todos os conhecimentos adquiridos com as aulas na área de 'Drug Discovery', esse tema foi escolhido pelo time da Alura esse ano e realmente foi um tema muito interessante pois a farmacologia é uma área de estudo que já existe há séculos e essa parte de descobrir novos compostos para fabricação de medicamentos demanda muito tempo e trabalho que podem ser otimizados através da tecnologia e da Ciência de Dados.
Os dados utilizados no projeto estão divididos em dois arquivos, um deles com informções de experimentos realizados onde foram medidos alterações em expressões gênicas quando certas culturas celulares foram submetidos a diferentes composto, o outro arquivo contém os resultados sobre as ativações desses mesmos experimentos.
O projeto começa com um resumo sobre a área de 'Drug Discovery' e após isso é dividido em diversos tópicos onde foram feitas as análises, são eles:
Na primeira etapa do projeto estão realizadas as importações dos pacotes utilizados em todo o projeto e dos arquivos onde se encontram os dados.
Nessa etapa o objetivo foi analisar como os dados estão distribuídos, analisando as variáveis dentro de dois grupos(categóricas e numéricas), foram utilizados diversos gráficos para melhorar o entendimento dessas variáveis.Além disso, nesta etapa foram realizados os devidos tratamentos dos dados.Foi análisado as proporcão dos dados em relação aos seus diversos atributos e sobre a distribuição das variáveis numéricas.
Na terceira etapa foi onde os dados foram concatenados e foi possível comparar os dados da base de dados dos experimentos e do resultado.Podendo confirmar hipóteses criadas na fase de análise.
Nesta etapa foi realizado a criação de dois modelos de machine learning, o primeiro com o objetivo para prever se certo experimento ativou algum mecanismo de ação ou não, e no outro o objetivo foi prever o tipo do experimento(com controle ou com composto).
Na última parte do projeto dei minhas conclusões sobre o projeto e os aprendizados dessa jornada.
Gostaria de agradecer a Alura por essa oportunidade e que continuem promovendo esse universo da Ciência de Dados aqui no Brasil pois esses eventos só agregam na vida daquelas que participam. Queria agradecer também aos professores Thiago Santos, Guilherme Silveira e Vanessa Leiko por elaborarem todo esse conteúdo, agradecer também a comunidade no discord onde todos sempre compatilhavam seus resultados e tiravam as dúvidas.