Зверніться зараз за безкоштовною підтримкою до нашого Центру послуг з кібербезпеки

Подати заявку на безкоштовну підтримку з кібербезпеки

Візьміть участь у літньому навчальному таборі з захисту від програм-вимагачів в Амстердамі, червень 2026 року

Відвідайте наш безкоштовний літній буткемп із захисту від програм-вимагачів

Зареєструйтесь на курс "Основи кібербезпеки" та AI в режимі онлайн

Дізнайтеся онлайн про основи кібербезпеки та AI

Навчання з підкріпленням

У цьому модулі розглядається навчання з підкріпленням - тип машинного навчання, де агенти вчаться приймати рішення, взаємодіючи з навколишнім середовищем, щоб максимізувати сукупну винагороду. Він охоплює такі ключові поняття, як процес прийняття рішень Маркова, оптимізація політики та методи, що базуються на цінності, а також застосування в таких сферах, як ігри, робототехніка та автономні системи...

Конструктор навчальних програм

Потрібна допомога? Натисніть тут за інструкціями.

Саттон, Річард С. та Ендрю Г. Барто. Навчання з підкріпленням: Вступ. Друге видання. Серія "Адаптивні обчислення та машинне навчання". Кембридж, Массачусетс: The MIT Press, 2018.

Кочендерфер, Майкл Д., Тім А. Вілер та Кайл Х. Рей. Алгоритми для прийняття рішень. Кембридж, Массачусетс: The MIT Press, 2022.

Агарвал, Алех, Нан Цзян та С. Какаде. "Навчання з підкріпленням: Теорія та алгоритми", 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Берцекас, Дмітрій П. Навчання з підкріпленням та оптимальне керування. 2-е видання (включає редакційні правки). Белмонт, штат Массачусетс: Athena Scientific, 2019.