-
Notifications
You must be signed in to change notification settings - Fork 0
Documentation — _CodeParsers.py
revoltMoon edited this page Nov 27, 2018
·
5 revisions
- Получение строк для проверки на наличие ссылок.
def _get_next_dec_for_link_checking( stringNumber:int, filePath:str)
- stringNumber - номер строки в файле, по умолчанию = 1;
- filePath - путь к файлу, по умолчанию =
PATH_TO_JSON_HEADERS_FOR_CHECKING_LINKS_FILENAME=os.path.join('Decision files', 'ForCheckingLinksDecisionHeaders.jsonlines')
.
- Класс, описывающий нахождение и обработку ссылок из документов.
- Инициализация регулярных выражений для нахождения ссылок.
def _init_patterns(cls)
- cls - представление класса.
- Получение ссылок первичной обработки.
def get_rough_links( cls, header: Header, sentenceMatchObjects: list, findInOpinion: bool)
- cls - представление класса;
- header — представление класса
Header
; - sentenceMatchObjects — объекты сопоставления предложений;
- findInOpinion — ищем ли в мнениях людей, по умолчанию = false.
- List[RoughLink] — ссылки первичной обработки.
- Получение ссылок конечной обработки.
def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])
- cls - представление класса;
- collected_links — словарь со списком представления класса
RoughLink
как элемент и представление классаHeader
как ключ; - courtSiteContent — словарь с представлением класса
Header
как элемент и строкой uid как ключ; - courtPrefix — префикс суда;
- headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
- Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]] — ссылки конечной обработки.
- Получаем обработанные ссылки из файла.
def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str, headersForCheckingLinks: dict[datetime.date,dict[str,str]])
- cls - представление класса;
- header — представление класса
Header
; - sentenceMatchObjects — объекты сопоставления предложений;
- headersBase — словарь с представлением класса
Header
как элемент и строкой uid как ключ; - supertype — супертип;
- headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
- Dict[Header, CleanLink] — словарь с обработанными ссылками.
- Класс, описывающий регулярные выражения для парсинга Кодекса Российской Федерации об административных правонарушениях.
- Класс, описывающий регулярные выражения для парсинга Гражданского кодекса Российской Федерации.
- Класс, описывающий регулярные выражения для парсинга Налогового кодекса Российской Федерации.
- Класс, описывающий регулярные выражения для парсинга Уголовного кодекса Российской Федерации.