Descriptif
Ce cours propose une introduction à l’apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning : An Introduction" de R. Sutton et A. Barto (disponible en ligne).
30 heures en présentiel
Diplôme(s) concerné(s)
Format des notes
Numérique sur 20Littérale/grade européenPour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées
Le rattrapage est autorisé (Note de rattrapage conservée écrêtée à une note seuil de 10)- le rattrapage est obligatoire si :
- Note initiale < 6
- le rattrapage peut être demandé par l'étudiant si :
- 6 ≤ note initiale < 10
- Crédits ECTS acquis : 3 ECTS
Le coefficient de l'UE est : 1
La note obtenue rentre dans le calcul de votre GPA.
Programme détaillé
-
- Introduction à l’apprentissage par renforcement et processus de décision markovien
-
- Le cas des bandits
-
- Méthodes tabulaires : prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning
-
- Planification et apprentissage pour les méthodes tabulaires
-
- Méthodes approchées : prédiction, planification et apprentissage.