← Retour au catalogue

Apprentissage par Renforcement

Deep Reinforcement Learning

Yaé Ulrich Gaba

M2-PhD 11 chapters FR + EN
Survolez ou touchez pour voir le résumé

En bref · In brief

Français

Apprentissage par renforcement, des fondements (MDP, programmation dynamique) aux algorithmes profonds modernes (DQN, Policy Gradient, Acteur-Critique, PPO, SAC). RL multi-agents, RL sûr, applications en robotique, jeux et contrôle.

English

Reinforcement learning from foundations (MDPs, dynamic programming) to modern deep algorithms (DQN, policy gradients, actor-critic, PPO, SAC). Multi-agent RL, safe RL, and applications to robotics, games, and control.

Table des matières

  1. Chapter 1 Processus de Décision Markovien
  2. Chapter 2 Programmation Dynamique
  3. Chapter 3 Méthodes Monte Carlo et Différences Temporelles
  4. Chapter 4 Q-Learning et SARSA
  5. Chapter 5 Deep Q-Network et Variantes
  6. Chapter 6 Gradients de Politique — REINFORCE
  7. Chapter 7 Méthodes Acteur-Critique
  8. Chapter 8 Algorithmes d’État de l’Art
  9. Chapter 9 RL Multi-Agents
  10. Chapter 10 RL avec Contraintes et Sécurité
  11. Chapter 11 Applications

Prérequis

Probabilités (chaînes de Markov), apprentissage profond (réseaux de neurones, optimisation par gradient).