Skip to content

Latest commit

 

History

History
17 lines (13 loc) · 1.92 KB

File metadata and controls

17 lines (13 loc) · 1.92 KB

learn_ML

Этот репозиторий содержит мою домашку по ML за осень 2020 года. Первые 2 решения я сдал вовремя. Потом я перестал сдавать решения вовремя, но очень стараюсь наверстать. Загруженные решения заданий:

  1. Линейная регрессия
  2. Логистическая регрессия
  3. Решающие деревья и случайный лес

Коммент к ДЗ 1: 3) Из графика видно, что кроссвалидация успешно примерно прогнозирует, какой будет работа алгоритма на тестовых данных 4) Я выбирал только числовые признаки, потому что не очень разобрался, как правильно работать с категориальными. Там в нотебуке видно (наверное, хоть он и не очень читаем), что

  • я проверял гистограмму (выбирал те, у которых нормальное/логнормальное распределение в основном )
  • проверял похожесть зависимости параметра и искомого на линейную
  • старался логически (common sense?) определять самые релевантные параметры
  1. Я только 2 собрал в среднее арифметическое. Та, которая хуже прогнозировала, увела результат в сторону. Возможно, стоит подбирать веса при таком "неравном" использовании нескольких регрессий. При равном, предполагаю, результат будет улучшаться