Deep Reinforcement Learning
Apprentissage par renforcement, des fondements (MDP, programmation dynamique) aux algorithmes profonds modernes (DQN, Policy Gradient, Acteur-Critique, PPO, SAC). RL multi-agents, RL sûr, applications en robotique, jeux et contrôle.
Reinforcement learning from foundations (MDPs, dynamic programming) to modern deep algorithms (DQN, policy gradients, actor-critic, PPO, SAC). Multi-agent RL, safe RL, and applications to robotics, games, and control.
Probabilités (chaînes de Markov), apprentissage profond (réseaux de neurones, optimisation par gradient).