Composante
Polytech Annecy-Chambéry
Description
Ce premier projet dans le cadre des Data Science vise à analyser quelles données sont nécessaires pour répondre au problème donné, à les acquérir puis à s'assurer de leur cohérence et compléter si certaines informations sont manquantes. Les données pourront être soit des données structurées comme nous pouvons les trouver dans des approches Open Data ou être des données non structurées comme du texte (avis sur les réseaux sociaux : recettes de cuisine, restaurants, etc.). Le projet donnera lieu à la réalisation d'un document qui fournira les modèles pour la réalisation de l'application ainsi que les schémas de base de données et les données nécessaires pour répondre au problème.
Objectifs
A l'issue de ce cours, l'étudiant sera capable :
- d'acquérir des données plus ou moins bien structurées,
- d'effectuer un nettoyage des données,
- de pallier au manque d'informations dans les données.
Heures d'enseignement
- Projet Data Science - TDTravaux Dirigés30h
Pré-requis obligatoires
Numération et Algorithmique (INFO 501) Base de données (INFO 502, INFO 642a) Conception et Programmation Orientée Objet (INFO 641a) Gestion de projets (PROJ 531)
Plan du cours
- Introduction au scraping
- Projet d'acquisition de données via scraping et API