Învățarea prin întărire

Acest modul explorează învățarea prin consolidare, un tip de învățare automată în care agenții învață să ia decizii prin interacțiunea cu un mediu pentru a maximiza recompensa cumulativă. Acesta acoperă concepte cheie precum procesul decizional Markov, optimizarea politicilor și metodele bazate pe valoare, împreună cu aplicații în domenii precum jocurile, robotica și sistemele autonome...

Portal > Inteligența artificială > Învățarea prin întărire

Constructor de curriculum

Sutton, Richard S., și Andrew G. Barto. Reinforcement Learning: An Introduction. Ediția a doua. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler și Kyle H. Wray. Algoritmi pentru luarea deciziilor. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang și S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Reinforcement Learning and Optimal Control. Tipărirea a 2-a (include revizuiri editoriale). Belmont, Massachusetts: Athena Scientific, 2019.

Vă mulțumim pentru că v-ați abonat la newsletter-ul nostru!

Vă mulțumim! RSVP primit pentru Sutton, Richard S., și Andrew G. Barto. Reinforcement Learning: An Introduction. Ediția a doua. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S., și Andrew G. Barto. Reinforcement Learning: An Introduction. Ediția a doua. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Încărcare...

Încărcare...