Composante
POLYTECH 2026-2027
Description
Ce module s'inscrit dans la continuité des modules traitant du big data et du machine learning dans lesquels les bases de la science des données a été présenté à travers les différents paradigmes de l'apprentissage automatique et de la statistique exploratoire. Leurs expérimentations à l'aide d'algorithmique de base ont mis en évidence les limites des outils basiques de modélisation.
Dans ce module, un ensemble de méthodes avancées, étendant les fondamentaux de l'apprentissage, est présenté. Chacune des approches permet d'améliorer le processus d'apprentissage en se focalisant sur un aspect particulier, par exemple la réduction de la variance des décisions, le traitement de problèmes non linéaires, ou encore l'apprentissage à partir d'un très grand nombre d'exemples et l'extraction automatique de caractéristiques. A une présentation conceptuelle des différentes méthodes, sera associée une réflexion sur leur implémentation et une expérimentation basée sur des cas concrets de recherche et développement.
Les Travaux Pratiques permettront aux étudiants de se familiariser avec les bibliothèques d'apprentissage avancé en Python puis d'utiliser certaines bibliothèques pour résoudre des problèmes d'apprentissage complexes, comme par exemple la
bibliothèque Keras pour l'apprentissage profond ou encore la bibliothèque arulesSequences pour l'extraction de motifs séquentiels. Des données de référence, comme par exemple la base MNIST (chiffres manuscrits) ou les bases CIFAR (objets et animaux) seront utilisées pour réaliser l'apprentissage de systèmes de classification.
Objectifs
Le cours vise à :
- identifier les avancées conceptuelles et technologiques associées au développement des méthodes d'apprentissage modernes
- mettre en oeuvre des méthodes d'apprentissage modernes en utilisant des outils de développement appropriés
Heures d'enseignement
- TDTravaux Dirigés33h
Pré-requis obligatoires
Les fondamentaux de l'analyse de données.
Les bases de l'apprentissage automatique.
Plan du cours
Panorama de méthodes avancées pour le big data
1. Machines à vecteurs supports et méthodes à noyaux
2. Apprentissage profond (deep learning)
3. Méthodes par renforcement
4. Séries temporelles et motifs séquentiels
Bibliographie
- T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning - Data Mining, Inference, and Prediction, Second Edition, Springer, 2013
- I. Goodfellow, Y. Bengio, A. Courville, Deep learning, MIT Press book, 2016