Skip to content

hse-econ-data-science/dap_2022-23

Repository files navigation

Data Analysis with Python, Анализ данных на python, коллекция весна 2022 и весна 2023

Этой весной вас ждёт курс по python. Следующей весной будет курс про анализ данных. После каждого из этих курсов будет независимый экзамен от ФКН. Будет, страшно, сложно и весело.

Python

Идеология курса

Основная цель курса - научить вас скриптованию. По его итогам вы должны смело уметь открывать python и писать гору кода для решения всех своих проблем.

Курс представляет из себя сочетания онлайн и офлайн частей. В офлайн-части, мы на семинарах вместе что-то делаем. В основном решаем задачи. В онлайн-части, вы изучаете курс на Coursera и дополнительные материалы, которые мы выкладываем.

Проверять то, как вы делаете онлайновую часть, мы не будем. Тем не менее, единственный способ научиться программировать - это много программировать. Если вы будете игнорировать онлайновую часть, довольно большой кусок практики выпадет из вашей жизни, а впоследствии на ср и экзамине возникнут проблемы.

Домашние задания и контрольные

Домашки:

Контрольные:

Примеры мини-самостоялок:

Большой план маленьких побед

Установите перед первым семинаром Anaconda. Инструкция для windows и инструкция для мака.

Anaconda - это дистрибутив для новичка. Обычно рано или поздно от него отказываются. Если вы жёсткий и вам знакомо слово терминал, можно поставить python и всё необходимое через него. Желательно сразу же делать это через pyenv.

  • sem01 Тратим полтора часа на то, чтобы запустить анаконду. Вводимся в python, git и делаем import this.
  • sem02 Говорим про циклы, условия, списки, что такое range (концепция генераторов на пальцах).
  • sem03 Говорим про изменяемые и незименяемые типы данных: списки, кортежи, строки и методы работы с ними. Обсуждаем как питон работает с памятью и где можно из-за этого накосячить.
  • sem04 Говорим о функциях и рекурсии. Решаем задачи на циклы и оформляем их в виде функций.
  • sem05 Говорим про словарики и множества
  • sem06 Решаем задачи на словари и множества. Немного говорим про collections.
  • sem07 Полезный функционал: list comprehension, map, lambda-функции, all, any, max, sorted, lambda внутри них как key и т.п. Мб про operator, collections и itertools
  • sem08 Чтение и запись в файлы. Типы файлов: txt, json, csv, tsv, pickle. Введение в pandas: подгрузили табличку и сделали минимальное её шатание. Сразу забыли про пандас до следующего года. На экзамене им пользоваться нельзя.
  • sem09 Учимся собирать данные, пишем парсеры.
  • sem10 Работа с API

Сдача домашек и контрольных

Сдача части домашних заданий и контрольных будет происходить через Яндекс.Контест. На почты вам будут разосланы логины и пароли от него.

Другая часть будет сдаваться через github. А может быть и через Anytask. Мы ещё не решили. До этой части домашек ещё дожить надо.

Самый важный раздел

Вы поулчаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

Min(10, 0.1*МСР + 0.4*БСР + 0.5*ДЗ),

где ДЗ — средняя оценка за все домашние задания (4 штуки), МСР — средняя оценка за все мини-самостоятельные работы на семинарах (около 6 штук), БСР — средняя оценка за все большие самостоятельные работы (3 штуки). Округление арифметическое.

Независимый экзамен вы пишите в конце курса и получаете по его итогам отдельную оценку. Будет пробный вариант.

Контрибьюторы и создатели

Ментально с нами <3:

Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии MIT License Материалы публикуются как общественное достояние.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published