Skip to content

Documentation — _KsrfParser.py

revoltMoon edited this page Nov 27, 2018 · 4 revisions

class KsrfParser

  • Парсит данные с сайта ksrf.ru.

get_rough_links

  • Начальная обработка постановлений.

Объявление

  • def get_rough_links(cls, header: Header, sentenceMatchObjects: list)

Параметры

  1. header — представление класса models.Header
  2. sentenceMatchObjects — объекты сопоставления предложений.

Возвращает

  1. {header: roughLinks}

get_clean_links

  • Конечная обработка ссылок на постановления.

Объявление

  • def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)

Параметры

  1. collected_links — словарь со списком представления класса RoughLink как элемент и представление класса Header как ключ.
  2. court_site_content — словарь с представлением класса DocumentHeader как элемент и строкой uid как ключ.
  3. courtPrefix — префикс суда.

Возвращает

Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]] — обработанные ссылки на постановления.

get_clean_links2

  • Конечная обработка ссылок на постановления.

Объявление

  • def get_clean_links2( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)

Параметры

  1. collected_links — словарь со списком представления класса RoughLink как элемент и представление класса Header как ключ.
  2. court_site_content — словарь с представлением класса DocumentHeader как элемент и строкой uid как ключ.
  3. courtPrefix — префикс суда.

Возвращает

Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]] — обработанные ссылки на постановления.

parse

  • Процесс парсинга данных с сайта.

Объявление

  • def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str headersForCheckingLinks: dict[datetime.date,dict[str,str]]) -> Dict[Header, CleanLink]

Параметры

  1. header — представление класса models.Header;
  2. sentenceMatchObjects — объекты сопоставления предложений;
  3. headersBase — база заголовков;
  4. supertype — супертип;
  5. headersForCheckingLinks — словарь заголовков для проверяемых ссылок.

Возвращает

1.cleanLinks: Dict[Header, CleanLink] — словарь с обработанными ссылками на постановления.