-
Notifications
You must be signed in to change notification settings - Fork 0
Documentation — _KsrfParser.py
revoltMoon edited this page Nov 27, 2018
·
4 revisions
- Парсит данные с сайта ksrf.ru.
- Начальная обработка постановлений.
def get_rough_links(cls, header: Header, sentenceMatchObjects: list)
- header — представление класса
models.Header
- sentenceMatchObjects — объекты сопоставления предложений.
{header: roughLinks}
- Конечная обработка ссылок на постановления.
def get_clean_links( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)
- collected_links — словарь со списком представления класса
RoughLink
как элемент и представление классаHeader
как ключ. - court_site_content — словарь с представлением класса
DocumentHeader
как элемент и строкой uid как ключ. - courtPrefix — префикс суда.
Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]]
— обработанные ссылки на постановления.
- Конечная обработка ссылок на постановления.
def get_clean_links2( cls, collectedLinks: Dict[Header, List[RoughLink]], courtSiteContent: Dict[str, Header], courtPrefix: str)
- collected_links — словарь со списком представления класса
RoughLink
как элемент и представление классаHeader
как ключ. - court_site_content — словарь с представлением класса
DocumentHeader
как элемент и строкой uid как ключ. - courtPrefix — префикс суда.
Tuple[Dict[Header, List[CleanLink]], Dict[Header, List[RoughLink]]]
— обработанные ссылки на постановления.
- Процесс парсинга данных с сайта.
def parse( cls, header: Header, sentenceMatchObjects: list, headersBase: Dict[str, Header], supertype: str headersForCheckingLinks: dict[datetime.date,dict[str,str]]) -> Dict[Header, CleanLink]
- header — представление класса
models.Header
; - sentenceMatchObjects — объекты сопоставления предложений;
- headersBase — база заголовков;
- supertype — супертип;
- headersForCheckingLinks — словарь заголовков для проверяемых ссылок.
1.cleanLinks: Dict[Header, CleanLink]
— словарь с обработанными ссылками на постановления.