Composante
POLYTECH 2026-2027
Description
Ce cours vise à analyser quelles données sont nécessaires pour répondre au problème donné, à les acquérir, puis à s'assurer de leur cohérence et de leur complétude via des analyses statistiques. Les données pourront être soit des données structurées comme nous pouvons les trouver dans des approches Open Data ou être des données non structurées comme du texte (avis sur les réseaux sociaux : recettes de cuisine, restaurants, etc.).
Objectifs
A l'issue de ce cours, l'étudiant sera capable :
- d'acquérir des données plus ou moins bien structurées,
- d'effectuer un nettoyage des données,
- de pallier au manque d'informations dans les données.
Heures d'enseignement
- CMCours Magistral13,5h
- TDTravaux Dirigés13,5h
- TPTravaux Pratiques20h
Pré-requis obligatoires
Bases de statistique, de programmation Python et web
Plan du cours
- Introduction au scraping
- Analyses et indicateurs statistiques de qualité de la donnée
- Projet d'acquisition de données via scraping et API