Composante
Polytech Annecy-Chambéry
Description
Ce cours présente les méthodes statistiques exploitées en analyse de données (analyse factorielle) ou en modélisation de la relation explicative d'une variable (régression) et positionne leur utilisation dans la pyramide de l’informatique décisionnelle moderne.
La première partie du cours est consacrée à l’analyse factorielle qui, par confrontation des espaces d’individus et de variables, enrichit l‘interprétation et permet d’exhiber la structure interne des données. La nature et le codage des données conduisent à deux variantes essentielles des méthodes factorielles, à savoir l’analyse en composantes principales (ACP) et l’analyse des correspondances multiples (ACM), combinées dans l’analyse factorielle multiple (AFM).
La seconde partie présente différents modèles de régression et les méthodes d’estimation de leurs paramètres, du modèle linéaire aux modèles plus complexes, de structure éventuellement mal connue, adaptés à différentes hypothèses sur la distribution des données.
Objectifs
Définir une modélisation adaptée à un jeu de données en se basant sur un ou plusieurs outil d'analyse de données
Estimer un modèle statistique multilinéaire et interpréter les résultats obtenus
Utiliser un modèle à des fins explicatives ou prédictives
Heures d'enseignement
- Informatique décisionnelle - CMCours Magistral9h
- Informatique décisionnelle - TDTravaux Dirigés9h
Pré-requis obligatoires
MATH741a, DATA732, ISOC631
Plan du cours
- La suite décisionnelle et l'analyse de données
- Les méthodes d'analyse exploratoire des données multidimensionnelles
- ACP : Analyse en Composantes Principales (variables quantitatives)
- ACM : Analyse des Correspondances Multiples (variables qualitatives)
- AFM : Analyse Factorielle Multiple (groupes de variables quantitatives et/ou qualitatives)
- Les régressions
- Régression linéaire (simple, multiple)
- Régression polynomiale
- Régression quantile
- Régression logistique
- Modèle linéaire généralisé
- Régression non paramétrique
- Régression en grande dimension (ridge, lasso)
Bibliographie
P.A. Cornillon, E. Matzner-Lober, Régression avec R, Collection Pratique R, Springer, 2011
T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning - Data Mining, Inference, and Prediction, Second Edition, Springer, 2013