forked from cristobalmitchell/pokedex
-
Notifications
You must be signed in to change notification settings - Fork 0
Home
JakubTehlar edited this page Dec 4, 2025
·
1 revision
Po konzultaci: Úkol: Liší se pozdější generace signifikantně od počátečních? Jak? 4 oblasti:
- Clustering generací ? jsou pozdější podobné navzájem, počáteční navzájem?
- Vzdálenost generací od sebe?
- clustering pokemonů? Zatím open ended. Jak porovnat časové změny tak, že naclusterujeme data? třeba je tam nějaký concept drift? změna distribuce?
- Úprava featur (jako úkol 3)
- mocniny, spliny, faktorizace etc.
- Lin modely, feature selection, statistické testy
- GLMs, jaké distribuce?, likelihood ratios …
- Porovnání modelů, interpretace, má vliv generace? (anova?)
- CV skrz time split? (udělám model DO gen e.g. 5 a predikuje dobře další generace?)
- Jak vypadají outlieři, proč (asi) jsou outlieři
- Co je na nich divnýho?
- Jiné metody porovnání outlierů (CV, Výběr?)
- Jak jsou rozloženi v generacích
- Je tam nějaký trend směrem k pozdějším generacím? signifikantní?
- Pokud je vyhodím, a udělám anova, je generace signifikantní? (základ, ne celý bod 2)
- Jaké testy? (rešerše)
- Testy pro časové řady
- Testy pro porovnání distribucí? 2 bodové T-testy? neparametrické testy na porovnání generací jako skupin pokemonů?
- Kde se generace navzájem mění? je to pre/post, nebo se střídají podobné?
- (menší téma, něco dalšího se tam najde!)
- (Teoretické)