Skip to content

Script que extrae los títulos y resumen de las noticias del covid-19 de la página del comercio

Notifications You must be signed in to change notification settings

RenatoCap/Comercio-covid-scrap

Repository files navigation

Comercio Covid Scrapper

En este proyecto se realizó un Script en python que extrare de la página del diario El Comercio , el titulo y el resumen de las noticias ubicadas en la sección COVID .

Archivos

En este repositorio se encuentra el archivo requirements.txt que contiene las librerías de python utilizadas en este proyecto, para instalarlo debe de ejecutar el siguiente código desde su terminar, dependiendo de que sistema operativo este utilizando, para Windows el comando es el siguiente:

py install -r requirements.txt

Si esta utilizando como sistema operativo linux, reemplazar el py por python3.

Además en el repositorio se encuentra el archivo robots.txt que contiene los permisos que nos da el diario el comercio para hacer Scrapping, permisos que fueron respetados al momento de realizar este mini proyecto.

En el archivo xpath.txt se encuentran los códigos xpath utilizados para poder hallar el contenido especifico de la web, pueden ser probados desde la consola de su navegador.

About

Script que extrae los títulos y resumen de las noticias del covid-19 de la página del comercio

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages