Pastiprināšanas mācīšanās

Šis modulis pēta pastiprinājuma mācīšanos, mašīnmācīšanās veidu, kurā aģenti apgūst lēmumu pieņemšanu, mijiedarbojoties ar vidi, lai maksimāli palielinātu uzkrāto atlīdzību. Tas aptver galvenos jēdzienus, piemēram, Markova lēmumu procesu, politikas optimizāciju un uz vērtībām balstītas metodes, kā arī pielietojumus tādās jomās kā spēļu izstrāde, robotika un autonomās sistēmas.

Portal > Mākslīgais intelekts > Pastiprināšanas mācīšanās

Mācību programmas veidotājs

Suttons, Ričards S. un Endrjū G. Barto. Pastiprināšanas mācīšanās: ievads. Otrais izdevums. Adaptīvās skaitļošanas un mašīnmācīšanās sērijas. Kembridža, Masačūsetsa: The MIT Press, 2018. gads.

Kochenderfer, Mykel J., Tim A. Wheeler un Kyle H. Wray. Algoritmi lēmumu pieņemšanai. Kembridža, Masačūsetsa: The MIT Press, 2022. gads.

Agarwal, Alekh, Nan Jiang un S. Kakade. “Pastiprināšanas mācīšanās: teorija un algoritmi”, 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Pastiprināšanas mācīšanās un optimāla kontrole. 2. iespiešana (ietver redakcionālus labojumus). Belmonta, Masačūsetsa: Athena Scientific, 2019. gads.

Thank you for signing up to our newsletter!

Thank you! RSVP received for Suttons, Ričards S. un Endrjū G. Barto. Pastiprināšanas mācīšanās: ievads. Otrais izdevums. Adaptīvās skaitļošanas un mašīnmācīšanās sērijas. Kembridža, Masačūsetsa: The MIT Press, 2018. gads.

Thank you for applying! We will be in touch.

Apply for: Suttons, Ričards S. un Endrjū G. Barto. Pastiprināšanas mācīšanās: ievads. Otrais izdevums. Adaptīvās skaitļošanas un mašīnmācīšanās sērijas. Kembridža, Masačūsetsa: The MIT Press, 2018. gads.

Suttons, Ričards S. un Endrjū G. Barto. Pastiprināšanas mācīšanās: ievads. Otrais izdevums. Adaptīvās skaitļošanas un mašīnmācīšanās sērijas. Kembridža, Masačūsetsa: The MIT Press, 2018. gads.

Loading...

Loading…