ссылка на сайт: http://vknyazkova.pythonanywhere.com/
Корпус содержит 500 рецептов на различную тематику с сайта ГАСТРОНОМЪ. Объем корпуса составляет около 60000 словоупотреблений.
Князькова Виктория - сборка сайта, функции поиска.
Васильева Варвара - обработка и преобразование данных из запросов.
Зенина Алена - парсинг сайта, препроцессинг текста.
Неминова Екатерина - морфологическая разметка, статистика.
В папке corpora содержится код, необходимый для сборки корпуса и подготовки статистики (topic modelling).
В папке search находится все необходимое для создания веб-приложения и реализации поиска (про поиск) по корпусу.