En este proyecto se realizó un Script en python que extrare de la página del diario El Comercio , el titulo y el resumen de las noticias ubicadas en la sección COVID .
En este repositorio se encuentra el archivo requirements.txt que contiene las librerías de python utilizadas en este proyecto, para instalarlo debe de ejecutar el siguiente código desde su terminar, dependiendo de que sistema operativo este utilizando, para Windows el comando es el siguiente:
py install -r requirements.txt
Si esta utilizando como sistema operativo linux, reemplazar el py por python3.
Además en el repositorio se encuentra el archivo robots.txt que contiene los permisos que nos da el diario el comercio para hacer Scrapping, permisos que fueron respetados al momento de realizar este mini proyecto.
En el archivo xpath.txt se encuentran los códigos xpath utilizados para poder hallar el contenido especifico de la web, pueden ser probados desde la consola de su navegador.