Apprentissage par Renforcement

Deep Reinforcement Learning

Yaé Ulrich Gaba

M2-PhD 11 chapters FR + EN

Description

Ce cours couvre l’apprentissage par renforcement (RL), des fondements (MDP, programmation dynamique) aux algorithmes profonds modernes (DQN, Policy Gradient, Acteur-Critique, PPO, SAC). On étudie également le RL multi-agents, le RL sûr (safe RL) et les applications en robotique, jeux et contrôle.

Chapter 1 Processus de Décision Markovien
Chapter 2 Programmation Dynamique
Chapter 3 Méthodes Monte Carlo et Différences Temporelles
Chapter 4 Q-Learning et SARSA
Chapter 5 Deep Q-Network et Variantes
Chapter 6 Gradients de Politique — REINFORCE
Chapter 7 Méthodes Acteur-Critique
Chapter 8 Algorithmes d’État de l’Art
Chapter 9 RL Multi-Agents
Chapter 10 RL avec Contraintes et Sécurité
Chapter 11 Applications

Prerequisites

Probabilités (chaînes de Markov), apprentissage profond (réseaux de neurones, optimisation par gradient).

Download

PDF FR PDF EN

Apprentissage par Renforcement

Description

Table of Contents

Prerequisites

Download