Acquisition et traitement statistique de la donnée (INFO635_IDUFISA)
Présentation
Ce cours vise à analyser quelles données sont nécessaires pour répondre au problème donné, à les acquérir, puis à s'assurer de leur cohérence et de leur complétude via des analyses statistiques. Les données pourront être soit des données structurées comme nous pouvons les trouver dans des approches Open Data ou être des données non structurées comme du texte (avis sur les réseaux sociaux : recettes de cuisine, restaurants, etc.).
Objectifs
A l'issue de ce cours, l'étudiant sera capable :
- d'acquérir des données plus ou moins bien structurées,
- d'effectuer un nettoyage des données,
- de pallier au manque d'informations dans les données.
Heures d'enseignement
| Cours Magistral | 13,5h | |
| Travaux Dirigés | 13,5h | |
| Travaux Pratiques | 20h |
Pré-requis obligatoires
Bases de statistique, de programmation Python et web
Plan du cours
- Introduction au scraping
- Analyses et indicateurs statistiques de qualité de la donnée
- Projet d'acquisition de données via scraping et API