ECTS
2 crédits
Composante
UFR Sciences et Montagne
Description
Avant de commencer une analyse de données, il faut bien comprendre les données que l'on va explorer, savoir les nettoyer et en évaluer la qualité. Ce travail fastidieux mais indispensable peut prendre jusqu'à 80% du temps dédié à un projet en science des données.
Objectifs
Le but de ce cours est de préciser les différents modèles de données qui permettent de faire les bons choix pour nettoyer les données et pour remplacer (ou pas) les données manquantes en se référant à la distribution théorique des données. Nous allons également évaluer la qualité des données pour pouvoir avoir en sortie des analyses ciblées et des méthodes prédictives pertinentes pour "faire parler les données".
Heures d'enseignement
- Projet en python - CMCours Magistral1,5h
- Projet en python - TDTravaux Dirigés3h
- Projet en python - TPTravaux Pratiques8h
Plan du cours
Le cours sera orienté projet avec une partie théorique et une grande partie de manipulation des données en TD et TP sur des données réelles.