← Back to catalog
Apprentissage par Renforcement
Deep Reinforcement Learning
Yaé Ulrich Gaba
M2-PhD
11 chapters
FR + EN
Description
Ce cours couvre l’apprentissage par renforcement (RL), des fondements (MDP, programmation dynamique) aux algorithmes profonds modernes (DQN, Policy Gradient, Acteur-Critique, PPO, SAC). On étudie également le RL multi-agents, le RL sûr (safe RL) et les applications en robotique, jeux et contrôle.
Table of Contents
- Chapter 1 Processus de Décision Markovien
- Chapter 2 Programmation Dynamique
- Chapter 3 Méthodes Monte Carlo et Différences Temporelles
- Chapter 4 Q-Learning et SARSA
- Chapter 5 Deep Q-Network et Variantes
- Chapter 6 Gradients de Politique — REINFORCE
- Chapter 7 Méthodes Acteur-Critique
- Chapter 8 Algorithmes d’État de l’Art
- Chapter 9 RL Multi-Agents
- Chapter 10 RL avec Contraintes et Sécurité
- Chapter 11 Applications
Prerequisites
Probabilités (chaînes de Markov), apprentissage profond (réseaux de neurones, optimisation par gradient).