Sustiprinimo mokymasis

Šis modulis nagrinėja stiprinamąjį mokymąsi, mašininio mokymosi tipą, kuriame agentai mokosi priimti sprendimus, sąveikaudami su aplinka, siekdami maksimaliai padidinti bendrą atlygį. Jame aptariamos pagrindinės sąvokos, tokios kaip Markovo sprendimų procesas, politikos optimizavimas ir vertėmis pagrįsti metodai, taip pat taikymas srityse, tokiose kaip žaidimai, robotika ir autonominės sistemos.

Mokymo programos kūrėjas

Reikia pagalbos? Spustelėkite čia, kad gautumėte instrukcijas.

Suttonas, Richardas S., ir Andrew G. Barto. Pastiprinimo mokymasis: įvadas. Antrasis leidimas. Adaptyvaus skaičiavimo ir mašininio mokymosi serija. Kembridžas, Masačusetsas: “The MIT Press”, 2018 m.

Kochenderferis, Mykelis J., Timas A. Wheeleris ir Kyle’as H. Wray. Sprendimų priėmimo algoritmai. Kembridžas, Masačusetsas: “The MIT Press”, 2022 m.

Agarwal, Alekh, Nan Jiang ir S. Kakade. “Sustiprinimo mokymasis: teorija ir algoritmai”, 2019 m.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Pastiprinimo mokymasis ir optimali kontrolė. 2-asis spausdinimas (įskaitant redakcinius pataisymus). Belmontas, Masačusetsas: Athena Scientific, 2019.