UE APM_5MS1A_TA | Catalogue 2025-2026

Descriptif

Ce cours propose une introduction à l’apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning : An Introduction" de R. Sutton et A. Barto (disponible en ligne).

30 heures en présentiel

Diplôme(s) concerné(s)

Parcours de rattachement

Master 2 MSV Mathématiques pour les Sciences du Vivant - Master 2

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Master 2 Mathématiques pour les Sciences du Vivant

Le rattrapage est autorisé (Note de rattrapage conservée)

L'UE est acquise si Note finale >= 10

Pour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées

Le rattrapage est autorisé (Max entre les deux notes écrêté à une note seuil)

le rattrapage est obligatoire si :
Note initiale < 6
le rattrapage peut être demandé par l'étudiant si :
6 ≤ note initiale < 10

L'UE est acquise si Note finale >= 10

Crédits ECTS acquis : 3 ECTS

Le coefficient de l'UE est : 1

La note obtenue rentre dans le calcul de votre GPA.

Programme détaillé

- Introduction à l’apprentissage par renforcement et processus de décision markovien
- Le cas des bandits
- Méthodes tabulaires : prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning
- Planification et apprentissage pour les méthodes tabulaires
- Méthodes approchées : prédiction, planification et apprentissage.

Cours scientifiques - APM_5MS1A_TA : Machine learning

Domaine > Applied Maths.