Uczenie się przez wzmacnianie

Ten moduł bada uczenie ze wzmocnieniem, rodzaj uczenia maszynowego, w którym agenci uczą się podejmowania decyzji poprzez interakcję z środowiskiem w celu maksymalizacji skumulowanej nagrody. Obejmuje kluczowe pojęcia, takie jak proces decyzyjny Markowa, optymalizacja polityki i metody oparte na wartościach, a także zastosowania w obszarach takich jak gry, robotyka i systemy autonomiczne.

Portal > Sztuczna inteligencja > Uczenie się przez wzmacnianie

Curriculum Builder

Suttona, Richarda S. i Andrew G. Barto. Uczenie się przez wzmacnianie: wprowadzenie. Wydanie drugie. Seria poświęcona obliczeniom adaptacyjnym i uczeniu maszynowemu. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfera, Mykela J., Tima A. Wheelera i Kyle’a H. Wraya. Algorytmy podejmowania decyzji. Cambridge, Massachusetts: Wydawnictwo MIT, 2022.

Agarwal, Alekh, Nan Jiang i S. Kakade. “Uczenie się przez wzmacnianie: teoria i algorytmy”, 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Uczenie się przez wzmacnianie i optymalna kontrola. 2. dodruk (zawiera poprawki redakcyjne). Belmont, Massachusetts: Athena Scientific, 2019.

Thank you for signing up to our newsletter!

Thank you! RSVP received for Suttona, Richarda S. i Andrew G. Barto. Uczenie się przez wzmacnianie: wprowadzenie. Wydanie drugie. Seria poświęcona obliczeniom adaptacyjnym i uczeniu maszynowemu. Cambridge, Massachusetts: The MIT Press, 2018.

Thank you for applying! We will be in touch.

Apply for: Suttona, Richarda S. i Andrew G. Barto. Uczenie się przez wzmacnianie: wprowadzenie. Wydanie drugie. Seria poświęcona obliczeniom adaptacyjnym i uczeniu maszynowemu. Cambridge, Massachusetts: The MIT Press, 2018.

Suttona, Richarda S. i Andrew G. Barto. Uczenie się przez wzmacnianie: wprowadzenie. Wydanie drugie. Seria poświęcona obliczeniom adaptacyjnym i uczeniu maszynowemu. Cambridge, Massachusetts: The MIT Press, 2018.

Loading...

Loading…