Požadavky pro studenty UK:
- alespoň 16b ze cvičení (každé za cca 4b)
Požadavky pro studenty FITu:
- alespoň 16b za cvičení (každé za cca 4b)
- projekt minimálně 50 %
Cvičení:
- Každý druhý týden v Út 12:45 TH:A-1142
- Zadání úlohy
Úlohy:
- ideálně do dalšího cvičení
- způsob odevzdání: nejlépe email
Projekt:
- Vybrat nějaký dataset, který Vás zajímá
- Explorace dat - Filtrace, Předzpracování
- Na základě explorace dat vybrat cca 3 klasifikátory
- Prozkoumat různé kombinace předzpracování a klasifikátorů na datech
- Porovnání modelů
- Výběr vhodného modelu vzhledem k účelu - (pro a proti)
! Za 0 bodů budou ohodnoceny projekty které:
- Budou testovat na trénovacích datech
- QDA, LDA, Naive Bayes, Gaussian Naive Bayes, Logistic Regression
- Classifier, Linear Classifier, Quadratic Classifier, QQ-plot, Histogram, Sigmoid function
- Imbalanced Dataset, ROC, AUC, PR
- Cost-Sensitive Classification, Theoretical Thresholding, Empirical Thresholding, Oversampling, Undersampling
- Class Weight, a priori probability
- Confusion Matrix
- PCA, Kernel PCA, Feature Transformation, Kernel Trick, Hard-SVM, Soft-SVM, Grid Search