Apprentissage automatique et fouille de données (INFO942_IAI)

Présentation

Ce module dédié à la fouille de données présente différentes méthodes d’apprentissage automatique pour construire des modèles à partir de données. Il s’agit de découvrir dans les données des structures ou motifs intéressants et d'en extraire des connaissances utiles à la conception d'outils intelligents ou à la compréhension de systèmes complexes. Issue de diverses disciplines scientifiques (statistiques, informatique, intelligence artificielle, ... ) la fouille de données est aujourd'hui exploitée dans de nombreux domaines d'activités.

Objectifs

Ce cours vise à rendre l'élève apte à :

Niveau

A l'issue de ce cours l'élève sera capable :

identifier les problèmes pouvant être abordés par des méthodes d’apprentissage automatique ou de fouille de données

Expertise

de citer quelques applications de la fouille de données

  

d'expliquer la nature des données disponibles et la catégorie d'apprentissage à réaliser

  

de formuler correctement un problème d’apprentissage automatique

choisir une famille de techniques appropriées à la résolution d'un problème particulier et argumenter son choix

Application

d'expliquer le fonctionnement d'un arbre de décision, d'un réseau de neurones, d'un classifieur bayésien, d'une approche kppv

  

d'expliquer en quoi consiste l’apprentissage de ces systèmes et de décrire les méthodes d’apprentissage associées

  

de choisir un codage approprié des données

utiliser une technique particulière pour résoudre un problème donné, interpréter et évaluer les résultats obtenus

Maîtrise

de différencier les erreurs d'apprentissage et de test et d'interpréter les matrices de confusion correspondantes

  

d'expliquer le principe de la cross-validation et d'utiliser les techniques associées

  

de mettre en forme les données, de déterminer les paramètres appropriés pour la méthode choisie et de réaliser l'apprentissage du système

Pré-requis

- IGI641b
- MATH741

Plan du cours

Plan du cours

  1. Problématique générale
    1. Quelques cas résolus
    2. Les données
    3. Typologie des problèmes
    4. Formulation d'un problème d'apprentissage
  2. Arbres de décision
    1. Représentation
    2. Apprentissage d'un arbre
    3. Algorithme Id3
    4. Mise en oeuvre sous Weka
    5. Limites et extensions
  3. Evaluation du système appris
    1. Approche théorique
    2. Approche expérimentale
    3. Bien apprendre / bien évaluer
  4. Panorama de méthodes
    1. Réseaux de neurones
    2. Systèmes bayésiens
    3. Raisonnement à partir de cas
  5. Ouverture sur d'autres approches
    1. SVM
    2. Apprentissage non supervisé
    3. Règles d'association

Travaux pratiques

Les TP sont réalisés avec le logiciel Weka (produit Open Source) qui se présente sous la forme d'une collection d'algorithmes d'apprentissage utilisables, soit directement dans l'environnement graphique de Weka, soit à partir d'un code Java.

  1. Découverte de Weka, arbres de décision, cross-validation
  2. Classifieurs bayésiens, kppv
  3. Réseaux de neurones multi-couches
  4. Programmation Java, construction d'ensembles de donnée, cross-validation

Volume horaire

  • CM : 12.0
  • TD : 7.5
  • TP : 16.0

Informations complémentaires

Bibliographie

  • T.M. Mitchell, "Machine Learning", McGraw-Hill Series, 1997.
  • S. Russell, P. Norvig, "Artificial Intelligence - A Modern Approach", Prentice Hall, 2003.
  • I.A Witten, E. Franck, "Data mining - Practical machine learning tools and techniques with Java implementations", Morgan Kaufmann Publishers, 1999.
  • François Denis, Rémi Gilleron, Apprentissage à partir d'exemples - Notes de Cours
  • Tom Mitchell, Transparents associés à l'ouvrage "Machine Learning"
  • Stuart Russell, Peter Norvig, Transparents associés à l'ouvrage "Artificial Intelligence - A Modern Approach"
  • Andrew Ng, Standford Machine Learning course
  • Weka 3: Data Mining Software in Java
  • UCI Machine Learning Repository

Diplômes intégrant ce cours

En bref

Langue d'enseignement
Français

Contact(s)

UFR, Écoles, Instituts

Lieu(x)

  • Annecy-le-Vieux (74)