Skip to content

OpenDataScience Machine Learning course (yet Russian-only)

Notifications You must be signed in to change notification settings

chezzdev/mlcourse_open

 
 

Repository files navigation

Открытый курс OpenDataScience по машинному обучению

ODS stickers

❗ Новая сессия стартовала 6 сентября 2017 г. Еще можно подключиться

Статья про курс на Хабре. Youtube-канал c онлайн-трансляциями и записями лекций. Курс обсуждается в Slack OpenDataScience в канале mlcourse_open. Заявка на вступление.

В статьях курса даются теоретические основы машинного обучения. Навыки практического анализа данных и построения прогнозных моделей можно получить через выполнение домашних заданий и индивидуального проекта, а также за счет участия в 2 соревнованиях по анализу данных. Требуются начальные навыки программирования на Python и знание математики (математический анализ, линейная алгебра, теория вероятностей, математическая статистика) на уровне 2 курса технического ВУЗа.

Статьи на Хабрахабре

  1. Первичный анализ данных с Pandas
  2. Визуальный анализ данных с Python
  3. Классификация, деревья решений и метод ближайших соседей
  4. Линейные модели классификации и регрессии
  5. Композиции: бэггинг, случайный лес
  6. Построение и отбор признаков
  7. Обучение без учителя: PCA и кластеризация
  8. Обучаемся на гигабайтах с Vowpal Wabbit
  9. Анализ временных рядов с помощью Python
  10. Градиентный бустинг. Часть 1
  11. Градиентный бустинг. Часть 2. Скоро...

Видеолекции

  1. Первичный анализ данных с Pandas
  2. Визуальный анализ данных с Seaborn и Matplotlib
  3. Беседа с А.Г. Дьяконовым

Домашние задания

  1. Анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V). Тетрадка, веб-форма для ответов, решение.
  2. Визуальный анализ данных по сердечно-сосудистым заболеваниям (ML Boot Camp V). Тетрадка, веб-форма. Дедлайн: 19.09.17 23:59 UTC +3.

Соревнования

  1. Идентификация пользователя по последовательности посещенных сайтов. Kaggle Inclass
  2. Прогноз популярности статьи на medium.com. Скоро...

Проекты

  1. Идентификация пользователей по последовательности посещенных сайтов. Описание. Тетрадки. Дедлайн: 08.11.17 23:59 UTC +3.
  2. Индивидуальные проекты. Скоро...

Рейтинг

На рейтинг участников влияют домашки, соревнования, проекты и тьюториалы.

Wiki-страницы этого репозитория:

  • Prerequisites: Python, математика, DevOps. О том, как лучше подготовиться к прохождению курса, если навыков программирования или знаний математики не хватает.
  • Домашние задания 1-ой сессии курса. С решениями. На текущий рейтинг не влияют.
  • Авторы статей и лекторы. Вкратце представляем всех, кто поработал над курсом.
  • ПО для прохождения курса и Docker – как настроить все ПО для прохождения курса. В частности, описывается, как запустить у себя Docker-контейнер, в котором уже все установлено.
  • Топ-100 1-ой сессии курса. 1 сессия курса прошла с 28 февраля по 10 июня 2017 года – с домашними заданими, соревнованиями, тьюториалами, конкурсами по визуализации и общим рейтингом. Более 500 участников, было весело 😀. Увековечим имена тех, кто попал в топ-100 финального рейтинга.
  • Тьюториалы. Одним из заданий в курсе было написать тьюториал на одну из тем вокруг машинного обучения и анализа данных.

About

OpenDataScience Machine Learning course (yet Russian-only)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%