Apprentissage par Renforcement

Deep Reinforcement Learning

Yaé Ulrich Gaba

M2-PhD 11 chapters FR + EN

Survolez ou touchez pour voir le résumé

En bref · In brief

Français

Apprentissage par renforcement, des fondements (MDP, programmation dynamique) aux algorithmes profonds modernes (DQN, Policy Gradient, Acteur-Critique, PPO, SAC). RL multi-agents, RL sûr, applications en robotique, jeux et contrôle.

English

Reinforcement learning from foundations (MDPs, dynamic programming) to modern deep algorithms (DQN, policy gradients, actor-critic, PPO, SAC). Multi-agent RL, safe RL, and applications to robotics, games, and control.

Table des matières

Chapter 1 Processus de Décision Markovien
Chapter 2 Programmation Dynamique
Chapter 3 Méthodes Monte Carlo et Différences Temporelles
Chapter 4 Q-Learning et SARSA
Chapter 5 Deep Q-Network et Variantes
Chapter 6 Gradients de Politique — REINFORCE
Chapter 7 Méthodes Acteur-Critique
Chapter 8 Algorithmes d’État de l’Art
Chapter 9 RL Multi-Agents
Chapter 10 RL avec Contraintes et Sécurité
Chapter 11 Applications

Apprentissage par Renforcement

En bref · In brief

Table des matières

Prérequis