Skip to content

Commit 7035d9f

Browse files
committed
doc - add link to slides to README.md
1 parent 209735b commit 7035d9f

File tree

1 file changed

+10
-10
lines changed

1 file changed

+10
-10
lines changed

README.md

Lines changed: 10 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -8,19 +8,19 @@
88
99
## Технический стек
1010

11-
* *H2O* automl для классификации - [ссылка](https://docs.h2o.ai/h2o/latest-stable/h2o-docs/automl.html)
12-
* *FAISS* для индексации и поиска похожих - [ссылка](https://github.com/facebookresearch/faiss)
13-
* *pandas* для манипулации с данными
11+
* *H2O* (java) automl для классификации - [ссылка](https://docs.h2o.ai/h2o/latest-stable/h2o-docs/automl.html)
12+
* *FAISS* (c++) для индексации и поиска похожих - [ссылка](https://github.com/facebookresearch/faiss)
13+
* *pandas* (python) для манипулации с данными
1414

1515
## Описание решения
1616

1717
> Общее описание, на чём основано
1818
19-
1. Строим мультиклассификатор для "сложных" полей ('*bedding*') на основе чистого датасета (самая популярная категория и "остальные")
20-
2. Строим индекс похожести среди категории "остальные" на основе чистого датасета
21-
3. Проходимся батчами по "грязному" датасета для предстказания
19+
1. Строим мультиклассификатор для "сложных" полей ('*bedding*') на основе "чистого" датасета (самая популярная категория и "остальные")
20+
2. Строим индекс похожести среди категории "остальные" на основе "чистого" датасета
21+
3. Проходимся батчами по "грязному" датасету для предстказания
2222
4. Делим категорию "остальные" через а) набор эвристики и б) по похожести
23-
5. Простые поля (например '*view*') определяем набором эвристики
23+
5. Простые поля (например '*view*') определяем набором эвристик
2424

2525
## Как запускать
2626

@@ -30,12 +30,12 @@
3030

3131
1. Необходимо установить зависимости requirements.txt для корректной работы python
3232
2. Необходимо установить JVM окружение для работы пакета H2O
33-
3. Необходим чистый датасет для обучения классификатора - предварительно скачиваем со страницы с описанием задания
33+
3. Необходим "чистый" датасет для обучения классификатора - предварительно скачиваем со страницы с описанием задания
3434

35-
Смотрите Dockerfile для деталей
35+
Смотрите Dockerfile для деталей установки
3636

3737
## Другие комментарии
3838

3939
> Любая другая полезная информация по решению
4040
41-
Ссылка на презентацию - ссылка
41+
Ссылка на презентацию - [ссылка](https://docs.google.com/presentation/d/1uMjiP3OGXJQ6TqASDWQKqKkDK3YL-Mv1/edit?usp=sharing&ouid=106504837995263103627&rtpof=true&sd=true)

0 commit comments

Comments
 (0)