Mokymasis naudojant pastiprinimą

Šiame modulyje nagrinėjamas mokymasis naudojant pastiprinimą - mašininio mokymosi rūšis, kai agentai mokosi priimti sprendimus sąveikaudami su aplinka, kad gautų kuo didesnį bendrą atlygį. Jame aptariamos pagrindinės sąvokos, tokios kaip Markovo sprendimų procesas, politikos optimizavimas ir verte pagrįsti metodai, taip pat jų taikymas tokiose srityse kaip žaidimai, robotika ir autonominės sistemos.

Portalas > Dirbtinis intelektas > Mokymasis naudojant pastiprinimą

Mokymo programos kūrėjas

Sutton, Richard S. ir Andrew G. Barto. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler ir Kyle H. Wray. Algoritmai sprendimų priėmimui. Cambridge, Massachusetts: MIT Press, 2022 m.

Agarwal, Alekh, Nan Jiang ir S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Mokymasis naudojant pastiprinimą ir optimalus valdymas. 2-asis leidimas (su redakciniais pakeitimais). Belmontas, Masačusetsas: Athena Scientific, 2019.

Dėkojame, kad užsiregistravote mūsų naujienlaiškiui!

Ačiū! Gauti Sutton, Richard S. ir Andrew G. Barto RSVP. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S. ir Andrew G. Barto. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Pakraunama...

Pakraunama...