Apprentissage par renforcement
3 ECTS, semestre 2, 8 semaines
Validation | CC+examen |
Enseignant | Sylvain Delattre |
Horaires hebdomadaires | 3.0 h CM |
Années | M2 Mathématiques et Informatique pour la Science des Données (DM) M2 Mathématiques et Informatique appliquées à la Science des données |
L'apprentissage par renforcement constitue, avec l'apprentissage supervisé et non-supervisé, l'une des trois grandes familles algorithmiques d'apprentissage automatique. Inspirée par la théorie de la décision et la psychologie comportementale, elle a pris une importance de premier plan ces dernières années en fusionnant avec d'autres méthodes d'apprentissage automatique, en particulier celle des réseaux profonds, donnant lieu à des champs d'application encore inexplorés.