From 0b54bc21e4ecd6e8482a7670d897eafdff54dad7 Mon Sep 17 00:00:00 2001 From: xadupre Date: Fri, 28 Feb 2025 04:46:54 +0100 Subject: [PATCH] plan --- _doc/articles/2025/2025-03-01-route2025.rst | 5 +++ _doc/articles/2025/2025-04-01-route2025.rst | 44 +++++++++++++++++++++ 2 files changed, 49 insertions(+) diff --git a/_doc/articles/2025/2025-03-01-route2025.rst b/_doc/articles/2025/2025-03-01-route2025.rst index 30e841e..481cf6a 100644 --- a/_doc/articles/2025/2025-03-01-route2025.rst +++ b/_doc/articles/2025/2025-03-01-route2025.rst @@ -160,3 +160,8 @@ Séance 5 (6/3) * analyses de survie * DeepAR * temps réel + +Evaluation +========== + +* https://defis.data.gouv.fr/ diff --git a/_doc/articles/2025/2025-04-01-route2025.rst b/_doc/articles/2025/2025-04-01-route2025.rst index 64ac004..74d28a7 100644 --- a/_doc/articles/2025/2025-04-01-route2025.rst +++ b/_doc/articles/2025/2025-04-01-route2025.rst @@ -118,3 +118,47 @@ Excel avec un graphe automatiquement depuis Python. * :ref:`l-example-serialization` * :ref:`l-example-plot-groupby` * :ref:`Manipulation de données avec pandas ` + +Journée 3 (3/3) +=============== + +**Partie 1** + +* retour sur la syntaxe du langage python, boucle, test, fonctions et classes +* exceptions +* expressions régulières +* pickle, fichiers pickle +* tests unitaires +* récupération des fichiers préparés pour la formation avec pandas +* utilisation de skrub pour avoir un premier aperçu + +**Partie 2** + +* rappel pandas: group by, jointure, inner, outer, left, right, pivot +* gestion des doublons +* une fois la base complète obtenue, analyse de nouveau +* même opérations en SQL +* identification des valeurs aberrantes +* valeurs manquantes, remplacement simple (moyenne), corrélations (KNNImputer) +* premières impressions + +Journée 4 (4/3) +=============== + +**Partie 1** + +* retour sur les graphes matplotlib, seaborn, plotly, skrub +* cartographie, cartopy, folium encore +* corrélations, pairplots +* gestion des dates +* cubes de données avec pandas, passer un indice à droite, à gauche +* on reprend chaque colonne + +**Partie 2** + +* notion d'itérateur en python +* application à pandas read_csv version itérateur pour manipuler des gros dataframes +* utilisation de sqlite3 (extension sqlite3 vscode) +* découpage d'une base en deux, apprentissage, respecter le temps et les identifiants +* calcul du prix d'un contrat d'assurance pour un an en fonction de + variables choisies