Pastiprināšanas mācīšanās

Šajā modulī tiek pētīta pastiprinājuma mācīšanās - mašīnmācīšanās veids, kurā aģenti mācās pieņemt lēmumus, mijiedarbojoties ar vidi, lai maksimizētu kumulatīvo atalgojumu. Tajā aplūkoti tādi galvenie jēdzieni kā Markova lēmumu pieņemšanas process, politikas optimizācija un uz vērtību balstītas metodes, kā arī to pielietojums tādās jomās kā spēles, robotika un autonomās sistēmas..

Portāls > Mākslīgais intelekts > Pastiprināšanas mācīšanās

Mācību programmas veidotājs

Sutton, Richard S. un Andrew G. Barto. Pastiprinājuma mācīšanās: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler un Kyle H. Wray. Algoritmi lēmumu pieņemšanai. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang un S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Pastiprinājuma mācīšanās un optimālā vadība. 2. izd. (ietver redakcionālus labojumus). Belmont, Massachusetts: Athena Scientific, 2019.

Paldies, ka pierakstījāties mūsu biļetenam!

Paldies! Saņemts RSVP par Sutton, Richard S. un Andrew G. Barto. Reinforcement Learning: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S. un Andrew G. Barto. Pastiprinājuma mācīšanās: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Iekraušana...

Iekraušana...