Skip to content

PedroHCAlmeida/imersao-dados-desafio-final

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

32 Commits
 
 
 
 
 
 

Repository files navigation

Projeto De Ciência De Dados Aplicada Na Área De 'Drug Discovery'

alt text

Neste repositório se encontra o projeto final da terceira edição da imersão dados, uma semana com aulas todos dias desenvolvidas pela Alura, a maior plataforma brasileira de cursos de tecnologia. Esse projeto foi desenvolvido em python e teve como objetivo aplicar todos os conhecimentos adquiridos com as aulas na área de 'Drug Discovery', esse tema foi escolhido pelo time da Alura esse ano e realmente foi um tema muito interessante pois a farmacologia é uma área de estudo que já existe há séculos e essa parte de descobrir novos compostos para fabricação de medicamentos demanda muito tempo e trabalho que podem ser otimizados através da tecnologia e da Ciência de Dados.

Dados

Os dados utilizados no projeto estão divididos em dois arquivos, um deles com informções de experimentos realizados onde foram medidos alterações em expressões gênicas quando certas culturas celulares foram submetidos a diferentes composto, o outro arquivo contém os resultados sobre as ativações desses mesmos experimentos.

Projeto

O projeto começa com um resumo sobre a área de 'Drug Discovery' e após isso é dividido em diversos tópicos onde foram feitas as análises, são eles:

1-Importações

Na primeira etapa do projeto estão realizadas as importações dos pacotes utilizados em todo o projeto e dos arquivos onde se encontram os dados.

2-Análise Exploratória e Limpeza Dos Dados

Nessa etapa o objetivo foi analisar como os dados estão distribuídos, analisando as variáveis dentro de dois grupos(categóricas e numéricas), foram utilizados diversos gráficos para melhorar o entendimento dessas variáveis.Além disso, nesta etapa foram realizados os devidos tratamentos dos dados.Foi análisado as proporcão dos dados em relação aos seus diversos atributos e sobre a distribuição das variáveis numéricas.

3-Juntar os dados do experimento e resultado

Na terceira etapa foi onde os dados foram concatenados e foi possível comparar os dados da base de dados dos experimentos e do resultado.Podendo confirmar hipóteses criadas na fase de análise.

4-Modelo de Machine Learning

Nesta etapa foi realizado a criação de dois modelos de machine learning, o primeiro com o objetivo para prever se certo experimento ativou algum mecanismo de ação ou não, e no outro o objetivo foi prever o tipo do experimento(com controle ou com composto).

5-Conclusões

Na última parte do projeto dei minhas conclusões sobre o projeto e os aprendizados dessa jornada.

Considerações

Gostaria de agradecer a Alura por essa oportunidade e que continuem promovendo esse universo da Ciência de Dados aqui no Brasil pois esses eventos só agregam na vida daquelas que participam. Queria agradecer também aos professores Thiago Santos, Guilherme Silveira e Vanessa Leiko por elaborarem todo esse conteúdo, agradecer também a comunidade no discord onde todos sempre compatilhavam seus resultados e tiravam as dúvidas.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%