Archive 2020
PrérequisNotions de base en probabilités, statistique, analyse des données, ou cours de la semaine de rentrée du M2 ISIFAR.
ValidationCC+examen
EnseignantAurélie Fischer
Années M2 ISIFAR

Syllabus

Le cours de Data Mining a pour objectif de présenter différentes techniques d'apprentissage supervisé (en classification et en régression) et non supervisé. L'apprentissage statistique désigne un ensemble de méthodes et d'algorithmes permettant d'extraire des informations pertinentes d'un ensemble de données et d'apprendre des comportements à partir d'exemples.

Sommaire

Nous nous intéresserons à des approches telles que la classification par les centres mobiles, les modèles de mélange gaussien, l'analyse discriminante linéaire et quadratique, la régression logistique, les classifieurs des plus proches voisins et à noyau, les arbres de décision ainsi que les méthodes bagging, boosting et forêts aléatoires, les machines à vecteurs de support, la régression ridge ou lasso ou encore les réseaux de neurones. Nous définirons les courbes ROC, évoquerons les problèmes de sélection de modèle et les méthodes de validation croisée. Une introduction à la théorie de Vapnik-Chervonenkis complètera le cours.