Composante
Polytech Annecy-Chambéry
Description
Descriptif
Les précédents projets (PROJ 631, 831, 931) visaient un développement et une exploitation sur un ordinateur personnel. Dans ce projet, il s'agira de dépasser les limites d'une unique machine et de considérer une approche Big Data et ses 3V : Volume, Vitesse et Variété. Sur ce projet, les étudiants devront fournir un système clé en main (par l'intermédiaire d'une machine virtuelle ou d'un conteneur Docker) répondant au problème posé. Ils devront donc trouver l'architecture nécessaire à mettre en place, les outils à utiliser ou créer et les bases de données à définir, tout cela dans le cadre d'un Cloud.
Objectifs
- Appréhender un problème de Data Science dans son intégralité;
- Définir le processus complet de l'acquisition des données jusqu'à la visualisation des données et les résultats;
- Concevoir un système qui nécessite des données massives, et du calcul distribué;
- Fournir un système clé en main pour répliquer le processus.
Heures d'enseignement
- TPTravaux Pratiques40h
Pré-requis obligatoires
- Systèmes distribués à large échelle (INFO 833)
- Bases de données distribuées (INFO 834)
Plan du cours
Les thèmes abordés et le déroulé sont variables et dépendent du sujet choisi.