Composante
Polytech Annecy-Chambéry
Description
Ce cours porte sur la conception et la mise en œuvre de bases de données distribuées pour le Big Data. Deux aspects y sont abordés : l'organisation des données (représentation, stockage, répartition) et l'organisation des traitements (définition, répartition, restitution).
Objectifs
L'objectif de ce cours est de fournir aux étudiants des connaissances et compétences qui leur permettront de choisir, concevoir et mettre en œuvre une représentation des données et des traitements adaptée aux besoins de l'application ou du système informatique à développer dans un contexte de big data.
Heures d'enseignement
- CMCours Magistral7,5h
- TDTravaux Dirigés7,5h
- TPTravaux Pratiques24h
Pré-requis obligatoires
INFO633_IDU
Plan du cours
- Introduction aux bases de données distribuées pour le Big Data : exigences et caractéristiques
- Concepts fondamentaux des SGBD NoSQL (vs. SQL) : schéma implicite, paires clé-valeur, bases orientées documents ou colonnes
- Théorème CAP et Propriétés BASE des SGBD NoSQL
- Développement de bases de données distribuées NoSQL (Redis, MongoDB, Neo4j, Parquet)
Des TD et TP permettront de mettre en œuvre les différentes technologies. Un mini projet intégrateur mené en équipe conclura le module.