Skip to content

ghss-k/Breast-cancer-prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Breast-cancer-prediction

L'objectif de ce projet est d'appliquer différentes méthodes de sélection de caractéristiques sur le jeu de données ‘Wisconsin Diagnostic Breast Cancer’ afin d'améliorer la qualité de la prédiction de la variable cible. Les méthodes de sélection des caractéristiques sont les suivantes : sélection basée sur l'importance, RFEcv, sélection basée sur la corrélation de Pearson, sélection basée sur le gain d'information, et Relief plus une méthode de sélection basée sur l'algorithme du graphe DFS. Nous avons également utilisé six algorithmes d'apprentissage automatique : eXtreme Gradient Boosting (XGB), Gradient Boosting (GB), Gaussian Naive Bayes (GNB), Random Forest (RF), Logistique Regression (LR) et K-Nearest Neighbors (KNN). La validation croisée k-fold et la validation croisée stratifié k-fold pour valider les modèles obtenus. qui sont évalués à l'aide des mesures de performance standard, y compris l’accuracy, la sensibilité, la spécificité, le mcc et l’AUC.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published