Descriptif
Contenu:
e cours est une introduction à l'apprentissage par renforcement orientée vers les mathématiques. L'objectif est de présenter les fondements de l'apprentissage par renforcement afin que les étudiants soient capables de lire et d'appliquer des articles de recherche. L'accent sera mis sur les mathématiques sous-jacentes afin de faciliter la compréhension de l'heuristique des algorithmes.
21 heures en présentiel
Diplôme(s) concerné(s)
- Inside ENSTA Paris
- Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées
- Master 2 Data Sciences
Parcours de rattachement
Format des notes
Numérique sur 20Pour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées
Pour les étudiants du diplôme Inside ENSTA Paris
Pour les étudiants du diplôme Master 2 Data Sciences
Le rattrapage est autorisé (Note de rattrapage conservée)- le rattrapage est obligatoire si :
- Note initiale < 7
- le rattrapage peut être demandé par l'étudiant si :
- 7 ≤ note initiale < 10
- Crédits ECTS acquis : 2.5 ECTS
Programme détaillé
Syllabus:
- Sequential Decisions, MDP and Policies
- Operations Research: Prediction and Planning
- Reinforcement Learning: Prediction and Planning in the Tabular Setting
- Reinforcement Learning: Advanced Techniques in the Tabular Setting
- Reinforcement Learning: Approximation of the Value Functions
- Reinforcement Learning: Policy Approach