Učení posilováním

Tento modul se zabývá posilováním učení, což je typ strojového učení, při kterém se agenti učí rozhodovat interakcí s prostředím s cílem maximalizovat kumulativní odměnu. Zahrnuje klíčové koncepty, jako je Markovův rozhodovací proces, optimalizace politik a metody založené na hodnotách, spolu s aplikacemi v oblastech, jako jsou hry, robotika a autonomní systémy.

Portál > Umělá inteligence > Učení posilováním

Tvůrce učebních osnov

Sutton, Richard S. a Andrew G. Barto. Reinforcement Learning: An Introduction. Druhé vydání. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler a Kyle H. Wray. Algoritmy pro rozhodování. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang a S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Reinforcement Learning and Optimal Control. 2. vydání (včetně redakčních úprav). Belmont, Massachusetts: Athena Scientific, 2019.

Děkujeme, že jste se přihlásili k odběru našeho newsletteru!

Děkujeme! RSVP obdržel Sutton, Richard S. a Andrew G. Barto. Reinforcement Learning: An Introduction. Druhé vydání. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S. a Andrew G. Barto. Reinforcement Learning: An Introduction. Druhé vydání. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Načítání...

Načítání...