• Votre sélection est vide.

    Enregistrez les diplômes, parcours ou enseignements de votre choix.

Données : modèle, qualité et nettoyage (PROJ702_MATH)

  • ECTS

    2 crédits

  • Composante

    UFR Sciences et Montagne

Description

Avant de commencer une analyse de données, il faut bien comprendre les données que l'on va explorer, savoir les nettoyer et en évaluer la qualité. Ce travail fastidieux mais indispensable peut prendre jusqu'à 80% du temps dédié à un projet en science des données.

Lire plus

Objectifs

Le but de ce cours est de préciser les différents modèles de données qui permettent de faire les bons choix pour nettoyer les données et pour remplacer (ou pas) les données manquantes en se référant à la distribution théorique des données. Nous allons également évaluer la qualité des données pour pouvoir avoir en sortie des analyses ciblées et des méthodes prédictives pertinentes pour "faire parler les données". 

Lire plus

Heures d'enseignement

  • Projet en python - CMCours Magistral1,5h
  • Projet en python - TDTravaux Dirigés3h
  • Projet en python - TPTravaux Pratiques8h

Plan du cours

Le cours sera orienté projet avec une partie théorique et une grande partie de manipulation des données en TD et TP sur des données réelles.

Lire plus