Piesakieties tagad, lai saņemtu bezmaksas atbalstu no mūsu Kiberdrošības pakalpojumu centra

Piesakieties bezmaksas kiberdrošības atbalstam

Piedalieties Ransomware aizsardzības vasaras treniņnometnē Amsterdamā, 2026. gada jūnijā

Apmeklējiet mūsu bezmaksas vasaras treniņnometni par aizsardzību pret izspiedējvīrusu programmatūru

Reģistrējieties kiberdrošības pamatos un AI tiešsaistes klātienes kursā

Uzziniet tiešsaistē par kiberdrošības pamatiem un AI

Pastiprināšanas mācīšanās

Šajā modulī tiek pētīta pastiprinājuma mācīšanās - mašīnmācīšanās veids, kurā aģenti mācās pieņemt lēmumus, mijiedarbojoties ar vidi, lai maksimizētu kumulatīvo atalgojumu. Tajā aplūkoti tādi galvenie jēdzieni kā Markova lēmumu pieņemšanas process, politikas optimizācija un uz vērtību balstītas metodes, kā arī to pielietojums tādās jomās kā spēles, robotika un autonomās sistēmas..

Mācību programmas veidotājs

Nepieciešama palīdzība? Noklikšķiniet šeit instrukcijas.

Sutton, Richard S. un Andrew G. Barto. Pastiprinājuma mācīšanās: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler un Kyle H. Wray. Algoritmi lēmumu pieņemšanai. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang un S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Pastiprinājuma mācīšanās un optimālā vadība. 2. izd. (ietver redakcionālus labojumus). Belmont, Massachusetts: Athena Scientific, 2019.

Pastiprināšanas mācīšanās

Mācību programmas veidotājs

Sutton, Richard S. un Andrew G. Barto. Pastiprinājuma mācīšanās: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler un Kyle H. Wray. Algoritmi lēmumu pieņemšanai. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang un S. Kakade. "Reinforcement Learning: Theory and Algorithms," 2019.

Bertsekas, Dimitri P. Pastiprinājuma mācīšanās un optimālā vadība. 2. izd. (ietver redakcionālus labojumus). Belmont, Massachusetts: Athena Scientific, 2019.

Kā darbojas mācību programmas veidotājs

Paldies, ka pierakstījāties mūsu biļetenam!

Paldies! Saņemts RSVP par Sutton, Richard S. un Andrew G. Barto. Reinforcement Learning: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S. un Andrew G. Barto. Pastiprinājuma mācīšanās: An Introduction. Otrais izdevums. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Iekraušana...