Scolarité M2 (sauf MIC, MIDS)
- Mme Chatoux
- bureau 5055
- 01 57 27 93 06
- Mme Prudlo
- bureau 5055
- 01 57 27 93 06
Prérequis | Notions de base en probabilités, statistique, analyse des données, ou cours de la semaine de rentrée du M2 ISIFAR. |
Validation | CC+examen |
Enseignant | Aurélie Fischer |
Années | M2 ISIFAR |
Le cours de Data Mining a pour objectif de présenter différentes techniques d'apprentissage supervisé (en classification et en régression) et non supervisé. L'apprentissage statistique désigne un ensemble de méthodes et d'algorithmes permettant d'extraire des informations pertinentes d'un ensemble de données et d'apprendre des comportements à partir d'exemples.
Nous nous intéresserons à des approches telles que la classification par les centres mobiles, les modèles de mélange gaussien, l'analyse discriminante linéaire et quadratique, la régression logistique, les classifieurs des plus proches voisins et à noyau, les arbres de décision ainsi que les méthodes bagging, boosting et forêts aléatoires, les machines à vecteurs de support, la régression ridge ou lasso ou encore les réseaux de neurones. Nous définirons les courbes ROC, évoquerons les problèmes de sélection de modèle et les méthodes de validation croisée. Une introduction à la théorie de Vapnik-Chervonenkis complètera le cours.