Apprentissage par renforcement

Ce module explore l’apprentissage par renforcement, un type d’apprentissage automatique où les agents apprennent à prendre des décisions en interagissant avec un environnement pour maximiser les récompenses cumulées. Il couvre des concepts clés tels que le processus de décision de Markov, l’optimisation des politiques et les méthodes basées sur la valeur, ainsi que des applications dans des domaines comme le jeu, la robotique et les systèmes autonomes.

Bâtisseur de programmes d'études

Besoin d’aide ? Cliquez ici pour obtenir des instructions.

Sutton, Richard S. et Andrew G. Barto. L’apprentissage par renforcement : une introduction. Deuxième édition. Série Calcul adaptatif et apprentissage automatique. Cambridge, Massachusetts : The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler et Kyle H. Wray. Algorithmes pour la prise de décision. Cambridge, Massachusetts : The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang et S. Kakade. « Apprentissage par renforcement : théorie et algorithmes », 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Apprentissage par renforcement et contrôle optimal. 2e impression (y compris les révisions rédactionnelles). Belmont, Massachusetts : Athena Scientific, 2019.

Apprentissage par renforcement

Bâtisseur de programmes d'études

Sutton, Richard S. et Andrew G. Barto. L’apprentissage par renforcement : une introduction. Deuxième édition. Série Calcul adaptatif et apprentissage automatique. Cambridge, Massachusetts : The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler et Kyle H. Wray. Algorithmes pour la prise de décision. Cambridge, Massachusetts : The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang et S. Kakade. « Apprentissage par renforcement : théorie et algorithmes », 2019.

Bertsekas, Dimitri P. Apprentissage par renforcement et contrôle optimal. 2e impression (y compris les révisions rédactionnelles). Belmont, Massachusetts : Athena Scientific, 2019.

Comment fonctionne le générateur de programmes d'études

Thank you for signing up to our newsletter!

Thank you! RSVP received for Sutton, Richard S. et Andrew G. Barto. L’apprentissage par renforcement : une introduction. Deuxième édition. Série Calcul adaptatif et apprentissage automatique. Cambridge, Massachusetts : The MIT Press, 2018.

Thank you for applying! We will be in touch.

Apply for: Sutton, Richard S. et Andrew G. Barto. L’apprentissage par renforcement : une introduction. Deuxième édition. Série Calcul adaptatif et apprentissage automatique. Cambridge, Massachusetts : The MIT Press, 2018.

Sutton, Richard S. et Andrew G. Barto. L’apprentissage par renforcement : une introduction. Deuxième édition. Série Calcul adaptatif et apprentissage automatique. Cambridge, Massachusetts : The MIT Press, 2018.

Chargement...