Skip to content

Latest commit

 

History

History
107 lines (44 loc) · 3.84 KB

README.md

File metadata and controls

107 lines (44 loc) · 3.84 KB

Módulo 4 - Data Wrangling

Objetivo del módulo: Aprender del proceso de Extracción Transofrmación y Carga (ETL) 📥 🔄 📤 ☁

Priorizando el cómo y de donde podemos conseguir datos para nuestros proyectos

Sesión 1 - Introducción a Data Wrangling / Data Engineering ☁️

Presentación

Challenge práctica de Pandas

Carpeta con datos para ejercicio de pandas

Sesión 2 - Bases de Datos No relacionales (NoSQL)

Descargar Mongo Compass

Crear cuenta en Mongo Atlas

Presentación de BD No relacionales

Colab de BD No relacionales_ Codigo Base

Carpeta con datos para nuestro cluster [Spotify, Amazon, etc]

Sesión 3 - ➕ More NoSQL DB con DODB usando Mongo 🍂 + APIs 🌐:

Continuación con Colab Mongo

Presentación de APIS

Sesión 4 - Modo código para entender las APIs (o sea la parte práctica de APIs)

Colab de APIs Vacío

Documentación de APIs Utilizadas en clase

Documentación de SWAPI Documentación de Coingecko Documentación de YELP

Extras

Referencia de Antiguo Challenge de Twitter

Sesión 5 - Web Scrapping

Presentación Web Srapping

Descarga Google Chrome

Descarga Driver para Chrome

Estos 2 sí los necesitaremos para la clase, los demás pueden esperar para la próxima

Descarga Visual Studio Puede ser Visual Studio o cualquier editor de código/tetxo que uds quieran (Sublime, Atom, El editor de notas de la propia compu, etc...)

Descarga Python Desktop

Sesión 6 - Web Scrapping (Parte práctica) 🤖 🕷

Colab Data Wrangling

Colab Web Scrapping actualizado CLASE 1 NOV 2023

Sesión 7 - Construye tu API 🤖 🕷

Código base

Código visto en clase 6 de Nov 2023

Crear cuenta en Pythonanywhere

Python Everywhere apra Deployar API

Postman

Software para hacer pruebas de peticiones

Sesión 8 - Vista de ave 🦅 a Apache Spark y herramientas de Nube ☁

Presentación