Recursos básicos para iniciarse en web scraping usando Python.
Clase dictada por Gustavo Juantorena (github / Linkedin) como docente invitado en la materia Text Mining de la Maestría en Explotación de Datos y Descubrimiento de Conocimiento de la Universidad de Buenos Aires. El contenido aquí expuesto excede lo que se vió en a clase, pero me parece que está bueno que lo tengan como referencia para profundizar los contenidos.
- Slides de la clase
- Primer Notebook de la clase (APIs + Beautiful Soup)
- Segunda Notebook de la clase (Selenium)
Update 2023: Cree un curso para freeCodeCamp que incluye la mayorìa del contenido de esta clase y pueden verlo acá
Casi todo es de https://developer.mozilla.org/es/ , uno de los mejores lugares para buscar referencia sobre tecnologías web.
- Listado de etiquetas HTML
- Material para CSS y listado de propiedades
- Material para JavaScript
- Generalidades del protocolo HTTP
- HTTP status codes
- Introducción al DOM
- Contenido del curso Scraping con Python
- Curso dictado por Mathias Gatti, Matías Grinberg y Gustavo Juantorena en humai.
- Aprovechen los videos si quieren ampliar sobre los temas vistos!
- Clases 18 y 19 de la materia Laboratorio de datos (FCEyN, UBA. 1er cuatrimestre 2021)
- Videos de las clases, slides y Notebooks para interacción con APIs (clase 18) y web scraping (clase 19).
- Docentes a cargo: Enzo Tagliazucchi, Sebastián Pinto, Tomás Cicchini y Ariel Berardino.
- Documentación oficial
- Web Scraping con Python - Curso con Beautiful Soup
- Beautiful Soup: Build a Web Scraper With Python