Skip to content

Latest commit

 

History

History
49 lines (38 loc) · 1.7 KB

README.md

File metadata and controls

49 lines (38 loc) · 1.7 KB

Проект асинхронного парсинга pep

Описание

Учебный проект на Scrapy, позволяет спрасить и сохранить в файл следующее:

  • Список актуальных PEP: номера, названия и статусы
  • Статистику статусов PEP

Требования:

  • Python 3
  • Scrapy
  • lxml
  • и их зависимости (описано в requirements.txt)

Установка и запуск:

  • клонировать репозиторий на машину, с которой будет будет запускаться сервис
git clone https://github.com/andmerk93/scrapy_parser_pep.git
  • На машине должен быть установлен Python актуальной версии (тестировалось на 3.11)
  • развернуть виртуальное окружение python в папке с проектом (scrapy_parser_pep)
python3 -m venv venv
  • активировать виртуальное окружение для linux/unix
source ./venv/bin/activate 
  • для Windows, должно быть разрешено выполнение скриптов Powershell
venv\Scripts\activate
  • с запущенным виртуальным окружением нужно выполнить установку требуемых компонентов
pip install -r requirements.txt
  • затем, выполнить команду
scrapy crawl pep

Файлы с результатами появятся в папке results