Sustiprinimo mokymasis

Šis modulis nagrinėja stiprinamąjį mokymąsi, mašininio mokymosi tipą, kuriame agentai mokosi priimti sprendimus, sąveikaudami su aplinka, siekdami maksimaliai padidinti bendrą atlygį. Jame aptariamos pagrindinės sąvokos, tokios kaip Markovo sprendimų procesas, politikos optimizavimas ir vertėmis pagrįsti metodai, taip pat taikymas srityse, tokiose kaip žaidimai, robotika ir autonominės sistemos.

Portal > Dirbtinis intelektas > Sustiprinimo mokymasis

Mokymo programos kūrėjas

Suttonas, Richardas S., ir Andrew G. Barto. Pastiprinimo mokymasis: įvadas. Antrasis leidimas. Adaptyvaus skaičiavimo ir mašininio mokymosi serija. Kembridžas, Masačusetsas: “The MIT Press”, 2018 m.

Kochenderferis, Mykelis J., Timas A. Wheeleris ir Kyle’as H. Wray. Sprendimų priėmimo algoritmai. Kembridžas, Masačusetsas: “The MIT Press”, 2022 m.

Agarwal, Alekh, Nan Jiang ir S. Kakade. “Sustiprinimo mokymasis: teorija ir algoritmai”, 2019 m.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Pastiprinimo mokymasis ir optimali kontrolė. 2-asis spausdinimas (įskaitant redakcinius pataisymus). Belmontas, Masačusetsas: Athena Scientific, 2019.

Thank you for signing up to our newsletter!

Thank you! RSVP received for Suttonas, Richardas S., ir Andrew G. Barto. Pastiprinimo mokymasis: įvadas. Antrasis leidimas. Adaptyvaus skaičiavimo ir mašininio mokymosi serija. Kembridžas, Masačusetsas: “The MIT Press”, 2018 m.

Thank you for applying! We will be in touch.

Apply for: Suttonas, Richardas S., ir Andrew G. Barto. Pastiprinimo mokymasis: įvadas. Antrasis leidimas. Adaptyvaus skaičiavimo ir mašininio mokymosi serija. Kembridžas, Masačusetsas: “The MIT Press”, 2018 m.

Suttonas, Richardas S., ir Andrew G. Barto. Pastiprinimo mokymasis: įvadas. Antrasis leidimas. Adaptyvaus skaičiavimo ir mašininio mokymosi serija. Kembridžas, Masačusetsas: “The MIT Press”, 2018 m.

Pakraunama...

Pakraunama…