Этот репозиторий содержит мою домашку по ML за осень 2020 года. Первые 2 решения я сдал вовремя. Потом я перестал сдавать решения вовремя, но очень стараюсь наверстать. Загруженные решения заданий:
- Линейная регрессия
- Логистическая регрессия
- Решающие деревья и случайный лес
Коммент к ДЗ 1: 3) Из графика видно, что кроссвалидация успешно примерно прогнозирует, какой будет работа алгоритма на тестовых данных 4) Я выбирал только числовые признаки, потому что не очень разобрался, как правильно работать с категориальными. Там в нотебуке видно (наверное, хоть он и не очень читаем), что
- я проверял гистограмму (выбирал те, у которых нормальное/логнормальное распределение в основном )
- проверял похожесть зависимости параметра и искомого на линейную
- старался логически (common sense?) определять самые релевантные параметры
- Я только 2 собрал в среднее арифметическое. Та, которая хуже прогнозировала, увела результат в сторону. Возможно, стоит подбирать веса при таком "неравном" использовании нескольких регрессий. При равном, предполагаю, результат будет улучшаться