التعلم المعزز

يستكشف هذا النموذج التعليمي التعلم التعزيزي، وهو نوع من التعلم الآلي حيث تتعلم الوكلاء اتخاذ القرارات من خلال التفاعل مع البيئة لتحقيق أقصى قدر من المكافآت التراكمية. يغطي مفاهيم رئيسية مثل عملية اتخاذ القرار ماركوف، تحسين السياسة، والطرق القائمة على القيم، بالإضافة إلى تطبيقات في مجالات مثل الألعاب، الروبوتات، والأنظمة المستقلة.

منشئ المناهج الدراسية

هل تحتاج إلى مساعدة؟ انقر هنا للحصول على التعليمات.

ساتون ، ريتشارد س. ، وأندرو جي بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2018.

كوشينديرفر ، ميكيل ج. ، تيم أ. ويلر ، وكايل إتش راي. خوارزميات لاتخاذ القرار. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2022.

أغاروال ، أليخ ، نان جيانغ ، و S. Kakade. “التعلم المعزز: النظرية والخوارزميات” ، 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

بيرتسيكاس ، ديميتري ب. التعلم المعزز والتحكم الأمثل. 2nd الطباعة (بما في ذلك المراجعات التحريرية). بلمونت ، ماساتشوستس: أثينا العلمية ، 2019.