Este repositorio contiene una colección de Notebooks desarrollados en Google Colaboratory. El propósito de estos Notebooks es ser una ayuda en el proceso de aprendizaje de Machine Learning (ML) y el Análisis Exploratorio de Datos (EDA, por sus siglas en ingles), en el lenguaje de programación de Python 3.
Observación 01. Los Notebooks estan organizados en una secuencia preliminar de trabajo. En general, encontrará que el conjunto de datos original se carga con un procesamiento simple. Por lo que los resultados no serían los óptimos o deseables en algunas ocasiones. Como parte de su proceso de aprendizaje, se sugiere replicar los procedimientos aplicados en los diferentes Notebooks para un único conjunto de datos ya ajustado o filtrado después de realizar el Análisis Exploratorio de Datos (EDA). Esto permitirá obtener un análisis más completo y detallado.
Observación 02: El hecho de que el mismo valor de
random_state
no genere consistentemente el mismo modelo en ejecuciones múltiples podría atribuirse a diversas causas, como posibles cambios en los datos entre ejecuciones, actualizaciones en la biblioteca de aprendizaje automático, variaciones en el entorno de ejecución o sistema operativo. Más información: lmcinnes/umap#153
Proporcionar conocimientos básicos en ML y EDA. En el futuro, espero poder ofrecer Notebooks más avanzados.
-
Entorno: Todos los Notebooks están diseñados para ejecutarse en Google Colab, un entorno basado en la nube que permite escribir y ejecutar código de Python de manera interactiva.
-
Estructura: Los Notebooks están organizados secuencialmente. Algunos temas previamente abordados pueden no ser explicados o replicados nuevamente, por lo que puede repasar los Notebooks o hacer una consulta rápida en las respectivas librerías.
-
Código Comentado: El código en los Notebooks está comentado en las partes necesarias, omitiendo algunas líneas en ocasiones para que usted llegue a sus propias conclusiones.
Al hacer clic en el icono ubicado al inicio del Notebook, se abrirá el Notebook en Google Colaboratory.
- 01a_Sismos_EDA: Notebook introductorio al EDA para el Dataset de Sismos
- 01b_Sismos_RegresionLineal: Notebook donde se genera un modelo de regresión lineal simple y regresión lineal múltiple para el Dataset de Sismos
- 01c_Sismos_DBSCAN: Notebook de clusterización utilizando el algoritmo DBSCAN para el catálogo sísmico.
- 01d_Sismos_KMeans: Notebook de clusterización utilizando el algoritmo K-Means para el catálogo sísmico.
- 02a_GeologiaMesa_MLPClassifier: Notebook de clasificación supervisada utilizando el Multi-layer Perceptron Classifier para el modelo geológico de la Mesa de Los Santos.
- 03a_Precipitacion_RegresionLogistica: Notebook para la predicción de probabilidades de lluvia en Bucaramanga (año 2020) mediante Logistic Regression.
- 04a_PlugsMesa_MLPRegressor: Notebook para la estimación de los valores de porosidad de las rocas aflorantes en la Mesa de Los Santos mediante el uso del Multi-layer Perceptron Regressor.
- 04b_PlugsMesa_Bootstrapping: Notebook sencillo del uso del Bootstrapping o remuestreo para los valores de porosidad del miembro superior de la Formación Los Santos, aflorante en la Mesa de Los Santos.
- 04c_PlugsMesa_PCA: Notebook sencillo que muestra el uso de PCA para la reducción de dimensiones, aplicado a las muestras de rocas aflorantes en la Mesa de Los Santos.
- 05a_Fracturas_DecisionTreeRegressor: Notebook para predecir la orientación de las fracturas en la Mesa de Los Santos utilizando el algoritmo Decision Tree Regressor.
- 06a_TREs_KNeighborsClassifier: Notebook de clasificación supervisada utilizando el K Neighbors Classifier para segmentar en categorías discretas los valores de resistividad eléctrica en siete Tomografías de Resistividad Eléctrica (TRE).
- 07a_YOLOv8_Amonites_20240323: Notebook de detección de Amonites reentrenando una CNN correspondiente a YOLOv8.
- 08a_MinimoLocal_MinimoGlobal: Notebook introductorio para entender el descenso del gradiente.
- 09a_Afloramiento_MapaVariografico: Notebook para entender qué es la semivarianza utilizando el mapa variográfico en una imagen de afloramiento.
- 10a_CalidadAire_RegresionLineal: Notebook para evidenciar cómo un modelo de regresión lineal se ve afectado por datos de entrenamiento con un comportamiento bimodal.
- En desarrollo ... ⌛
¡Las contribuciones y sugerencias son bienvenidas! Si encuentras errores o tienes ideas para mejorar los Notebooks, no dudes en informarlo. ¡Agradezco su colaboración!
¡Feliz aprendizaje de Machine Learnign 🤖 y Exploratory Data Analysis 📈!