Skip to content
JakubTehlar edited this page Dec 4, 2025 · 1 revision

Po konzultaci: Úkol: Liší se pozdější generace signifikantně od počátečních? Jak? 4 oblasti:

Clustering (Barca)

  • Clustering generací ? jsou pozdější podobné navzájem, počáteční navzájem?
  • Vzdálenost generací od sebe?
  • clustering pokemonů? Zatím open ended. Jak porovnat časové změny tak, že naclusterujeme data? třeba je tam nějaký concept drift? změna distribuce?

GLMs (Jenda)

  • Úprava featur (jako úkol 3)
  • mocniny, spliny, faktorizace etc.
  • Lin modely, feature selection, statistické testy
  • GLMs, jaké distribuce?, likelihood ratios …
  • Porovnání modelů, interpretace, má vliv generace? (anova?)
  • CV skrz time split? (udělám model DO gen e.g. 5 a predikuje dobře další generace?)

Outlier analýza (Kubo)

  • Jak vypadají outlieři, proč (asi) jsou outlieři
  • Co je na nich divnýho?
  • Jiné metody porovnání outlierů (CV, Výběr?)
  • Jak jsou rozloženi v generacích
  • Je tam nějaký trend směrem k pozdějším generacím? signifikantní?
  • Pokud je vyhodím, a udělám anova, je generace signifikantní? (základ, ne celý bod 2)

Statistické testy pro časová data. (Honza)

  • Jaké testy? (rešerše)
  • Testy pro časové řady
  • Testy pro porovnání distribucí? 2 bodové T-testy? neparametrické testy na porovnání generací jako skupin pokemonů?
  • Kde se generace navzájem mění? je to pre/post, nebo se střídají podobné?
  • (menší téma, něco dalšího se tam najde!)
  • (Teoretické)