Descriptif
Ce cours propose une introduction à l’apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning : An Introduction" de R. Sutton et A. Barto (disponible en ligne).
30 heures en présentiel
Diplôme(s) concerné(s)
- Master 2 Mathématiques pour les Sciences du Vivant
- Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées
Parcours de rattachement
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme Master 2 Mathématiques pour les Sciences du Vivant
Le rattrapage est autorisé (Note de rattrapage conservée)Pour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées
Le rattrapage est autorisé (Max entre les deux notes écrêté à une note seuil)- le rattrapage est obligatoire si :
- Note initiale < 6
- le rattrapage peut être demandé par l'étudiant si :
- 6 ≤ note initiale < 10
- Crédits ECTS acquis : 3 ECTS
Le coefficient de l'UE est : 1
La note obtenue rentre dans le calcul de votre GPA.
Programme détaillé
-
- Introduction à l’apprentissage par renforcement et processus de décision markovien
-
- Le cas des bandits
-
- Méthodes tabulaires : prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning
-
- Planification et apprentissage pour les méthodes tabulaires
-
- Méthodes approchées : prédiction, planification et apprentissage.