L'objectif de ce projet est d'appliquer différentes méthodes de sélection de caractéristiques sur le jeu de données ‘Wisconsin Diagnostic Breast Cancer’ afin d'améliorer la qualité de la prédiction de la variable cible. Les méthodes de sélection des caractéristiques sont les suivantes : sélection basée sur l'importance, RFEcv, sélection basée sur la corrélation de Pearson, sélection basée sur le gain d'information, et Relief plus une méthode de sélection basée sur l'algorithme du graphe DFS. Nous avons également utilisé six algorithmes d'apprentissage automatique : eXtreme Gradient Boosting (XGB), Gradient Boosting (GB), Gaussian Naive Bayes (GNB), Random Forest (RF), Logistique Regression (LR) et K-Nearest Neighbors (KNN). La validation croisée k-fold et la validation croisée stratifié k-fold pour valider les modèles obtenus. qui sont évalués à l'aide des mesures de performance standard, y compris l’accuracy, la sensibilité, la spécificité, le mcc et l’AUC.
-
Notifications
You must be signed in to change notification settings - Fork 0
ghss-k/Breast-cancer-prediction
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published