Навчання з підкріпленням

У цьому модулі розглядається навчання з підкріпленням - тип машинного навчання, де агенти вчаться приймати рішення, взаємодіючи з навколишнім середовищем, щоб максимізувати сукупну винагороду. Він охоплює такі ключові поняття, як процес прийняття рішень Маркова, оптимізація політики та методи, що базуються на цінності, а також застосування в таких сферах, як ігри, робототехніка та автономні системи...

Портал > Штучний інтелект > Навчання з підкріпленням

Конструктор навчальних програм

Саттон, Річард С. та Ендрю Г. Барто. Навчання з підкріпленням: Вступ. Друге видання. Серія "Адаптивні обчислення та машинне навчання". Кембридж, Массачусетс: The MIT Press, 2018.

Кочендерфер, Майкл Д., Тім А. Вілер та Кайл Х. Рей. Алгоритми для прийняття рішень. Кембридж, Массачусетс: The MIT Press, 2022.

Агарвал, Алех, Нан Цзян та С. Какаде. "Навчання з підкріпленням: Теорія та алгоритми", 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Берцекас, Дмітрій П. Навчання з підкріпленням та оптимальне керування. 2-е видання (включає редакційні правки). Белмонт, штат Массачусетс: Athena Scientific, 2019.

Дякуємо, що підписалися на нашу розсилку!

Дякуємо! Отримано відповідь на реєстрацію для Саттона, Річарда С. та Ендрю Г. Барто. Навчання з підкріпленням: Вступ. Друге видання. Серія "Адаптивні обчислення та машинне навчання". Кембридж, Массачусетс: The MIT Press, 2018.

Саттон, Річард С. та Ендрю Г. Барто. Навчання з підкріпленням: Вступ. Друге видання. Серія "Адаптивні обчислення та машинне навчання". Кембридж, Массачусетс: The MIT Press, 2018.

Завантаження...

Завантаження...