Skip to content

Latest commit

 

History

History
56 lines (41 loc) · 5.46 KB

README.md

File metadata and controls

56 lines (41 loc) · 5.46 KB

Анализ данных на python (коллекция весна 2024)

Полезные ссылки

Идеология курса

Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.

На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)

Большой план маленьких побед

  • sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
  • sem02 Вводимся в numpy
  • sem03 Вводимся в pandas и визуализацию
  • sem04 Больше EDA и разной визуализации!
  • sem05 Парсеры
  • sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
  • sem07 Разбираемся с линейной регрессией и как её обучить.
  • sem08 Обсуждаем регуляризацию и подбор гиперпараметров
  • sem09 Что такое классификация и логистическая регрессия?
  • sem10 Метрики классификации. Roc-auc.
  • sem11 Метод моментов, ЦПТ, доверительные интервалы.
  • sem12 АБ-тестирование, гипотезы, критерии.
  • sem13 Больше гипотез и критериев! Непараметрические тесты.
  • sem14 Семинар про бустрап.
  • sem15 Метод максимального правдоподобия.

Самый важный раздел

Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

Итог = MIN(8, Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР))
  • МСР — мини-тесты на парах
  • ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
  • П — свой проект длинной в модуль (расскажем детали позже)
  • КР — контрольная в виде демо-варианта независимого экзамена

Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером. Получить оценку выше 8 по правилам ВШЭ нельзя. Если хочется больше, надо сдать НЭ и перезачесть его.

Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.