v2.11.0 (6217)

Cours scientifiques - APM_5MS1A_TA : Machine learning

Domaine > Applied Maths.

Descriptif

Ce cours propose une introduction à l’apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning : An Introduction" de R. Sutton et A. Barto (disponible en ligne).

Format des notes

Numérique sur 20

Littérale/grade européen

Pour les étudiants du diplôme Master 2 Mathématiques pour les Sciences du Vivant

Le rattrapage est autorisé (Note de rattrapage conservée)
    L'UE est acquise si Note finale >= 10

      Pour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées

      Le rattrapage est autorisé (Max entre les deux notes écrêté à une note seuil)
      • le rattrapage est obligatoire si :
        Note initiale < 6
      • le rattrapage peut être demandé par l'étudiant si :
        6 ≤ note initiale < 10
      L'UE est acquise si Note finale >= 10
      • Crédits ECTS acquis : 3 ECTS

      Le coefficient de l'UE est : 1

      La note obtenue rentre dans le calcul de votre GPA.

      Programme détaillé

      • -  Introduction à l’apprentissage par renforcement et processus de décision markovien

      • -  Le cas des bandits

      • -  Méthodes tabulaires : prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning

      • -  Planification et apprentissage pour les méthodes tabulaires

      • -  Méthodes approchées : prédiction, planification et apprentissage.

      Veuillez patienter