Skip to content

Documentation — _CodeParsers.py

revoltMoon edited this page Nov 27, 2018 · 5 revisions

_get_next_dec_for_link_checking

  • Получение строк для проверки на наличие ссылок.

Объявление

  • def _get_next_dec_for_link_checking( stringNumber:int, filePath:str)

Параметры

  1. stringNumber - номер строки в файле, по умолчанию = 1;
  2. filePath - путь к файлу, по умолчанию = PATH_TO_JSON_HEADERS_FOR_CHECKING_LINKS_FILENAME=os.path.join('Decision files', 'ForCheckingLinksDecisionHeaders.jsonlines').

class _BaseCodeParser

  • Класс, описывающий нахождение и обработку ссылок из документов.

_init_patterns

  • Инициализация регулярных выражений для нахождения ссылок.

Объявление

  • def _init_patterns(cls)

Параметры

  1. cls - представление класса.

get_rough_links

  • Получение ссылок первичной обработки.

Объявление

  • def get_rough_links( cls, header: Header, sentenceMatchObjects: list, findInOpinion: bool)

Параметры

  1. cls - представление класса;
  2. header — представление класса Header;
  3. sentenceMatchObjects — объекты сопоставления предложений;
  4. findInOpinion — ищем ли в мнениях людей, по умолчанию = false.

Возвращает

  1. List[RoughLink] — ссылки первичной обработки.

get_clean_links

  • Получение ссылок конечной обработки.

Объявление

  • def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])

Параметры

  1. cls - представление класса;
  2. collected_links — словарь со списком представления класса RoughLink как элемент и представление класса Header как ключ;
  3. courtSiteContent — словарь с представлением класса Header как элемент и строкой uid как ключ;
  4. courtPrefix — префикс суда;
  5. headersForCheckingLinks — словарь заголовков для проверяемых ссылок.

Возвращает

  1. Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]] — ссылки конечной обработки.

parse

  • Получаем обработанные ссылки из файла.

Объявление

  • def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])

Параметры

  1. cls - представление класса;
  2. header — представление класса Header;
  3. sentenceMatchObjects — объекты сопоставления предложений;
  4. headersBase — словарь с представлением класса Header как элемент и строкой uid как ключ;
  5. supertype — супертип;
  6. headersForCheckingLinks — словарь заголовков для проверяемых ссылок.

Возвращает

  1. Dict[Header, CleanLink] — словарь с обработанными ссылками.

KoaprfCodeParser(_BaseCodeParser)

  • Класс, описывающий регулярные выражения для парсинга Кодекса Российской Федерации об административных правонарушениях.

GkrfCodeParser(_BaseCodeParser)

  • Класс, описывающий регулярные выражения для парсинга Гражданского кодекса Российской Федерации.

NkrfCodeParser(_BaseCodeParser)

  • Класс, описывающий регулярные выражения для парсинга Налогового кодекса Российской Федерации.

UkrfCodeParser(_BaseCodeParser)

  • Класс, описывающий регулярные выражения для парсинга Уголовного кодекса Российской Федерации.