Skip to content

Latest commit

 

History

History
49 lines (33 loc) · 3.04 KB

README.md

File metadata and controls

49 lines (33 loc) · 3.04 KB

Дамп block.kf.mgts.ru

Дамп предназначен исключительно для мониторинга реестра заблокированных ресурсов, не является каталогом. На данный момент содержит диапазон идентификаторов 0 - 16.000.000

Запси

Записи разделены символом переноса "\n".

9072666	1	7	http://lingscars.com
12343533	0		http://nablawiki.ru/index.php/Справочник_наблюдателя
13743110	1	1,4,5	http://gribo4ek/forum
15070369	0		http://ru.wikipedia.org/wiki/Демократия_в_России

Если запись отсутствует - значит url не указан на странице блокировки, вероятно запись удалена или не существовала вовсе

Параметры

Параметры списка разделены символом табуляции "\t".

Внимание! Ограничивайте split() при парсинге четырьмя частями т.к некоторые url в списке содержат символ табуляции

Уникальный идентификатор записи

http://block.kf.mgts.ru/?sid=xxxxxxxxxxx

Отображается ли URL на странице блокировки

  • 0 - Не отображается
  • 1 - Отображается

Скрытый URL собирается из скрипта для отправки уведомления об ошибке

Список категорий

Названия категорий парсятся из тела страницы блокировки. Указаны в виде соответствующих id, либо отсутствуют. Если категорий несколько, id разделены запятой.

  1. Запрещенные законодательством
  2. Азартные игры
  3. Экстремизм и терроризм
  4. Сайты для взрослых
  5. Вредные привычки
  6. Опасные ресурсы
  7. Подозрительные ресурсы

До индекса sid 9116221 причина блокировки берётся только из фразы "т.к. относится к категориям/категории:" и может отсутствовать в дампе, в последующих индексах причина забирается также из фразы "т.к. относится к категории:".

Адрес заблокированной страницы/ресурса

  • Может включать в себя ip адрес в виде http url
  • В реестре встречаются url, содержащие символ табуляции, ограничивайте разделение при парсинге split("\t", 4)
  • В реестре встречаются url, содержащие символ переноса, он удалён без последствий