Kreipkitės dabar dėl nemokamos mūsų Kibernetinio saugumo paslaugų centro pagalbos

Kreipkitės dėl nemokamos kibernetinio saugumo paramos

Dalyvaukite "Ransomware Defence Summer Bootcamp" stovykloje Amsterdame, 2026 m. birželio mėn.

Dalyvaukite mūsų nemokamoje vasaros apsaugos nuo išpirkos reikalaujančių programų stovykloje

Registruokitės į kibernetinio saugumo pagrindus ir AI internetinį tiesioginį kursą

Sužinokite internete apie kibernetinio saugumo pagrindus ir AI

Mokymasis naudojant pastiprinimą

Šiame modulyje nagrinėjamas mokymasis naudojant pastiprinimą - mašininio mokymosi rūšis, kai agentai mokosi priimti sprendimus sąveikaudami su aplinka, kad gautų kuo didesnį bendrą atlygį. Jame aptariamos pagrindinės sąvokos, tokios kaip Markovo sprendimų procesas, politikos optimizavimas ir verte pagrįsti metodai, taip pat jų taikymas tokiose srityse kaip žaidimai, robotika ir autonominės sistemos.

Mokymo programos kūrėjas

Reikia pagalbos? Spauskite čia instrukcijų.

Sutton, Richard S. ir Andrew G. Barto. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler ir Kyle H. Wray. Algoritmai sprendimų priėmimui. Cambridge, Massachusetts: MIT Press, 2022 m.

Agarwal, Alekh, Nan Jiang ir S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Mokymasis naudojant pastiprinimą ir optimalus valdymas. 2-asis leidimas (su redakciniais pakeitimais). Belmontas, Masačusetsas: Athena Scientific, 2019.

Mokymasis naudojant pastiprinimą

Mokymo programos kūrėjas

Sutton, Richard S. ir Andrew G. Barto. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler ir Kyle H. Wray. Algoritmai sprendimų priėmimui. Cambridge, Massachusetts: MIT Press, 2022 m.

Agarwal, Alekh, Nan Jiang ir S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

Bertsekas, Dimitri P. Mokymasis naudojant pastiprinimą ir optimalus valdymas. 2-asis leidimas (su redakciniais pakeitimais). Belmontas, Masačusetsas: Athena Scientific, 2019.

Kaip veikia mokymo programos sudarytojas

Dėkojame, kad užsiregistravote mūsų naujienlaiškiui!

Ačiū! Gauti Sutton, Richard S. ir Andrew G. Barto RSVP. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S. ir Andrew G. Barto. Reinforcement Learning: An Introduction. Antrasis leidimas. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Pakraunama...