التعلم المعزز

يستكشف هذا النموذج التعليمي التعلم التعزيزي، وهو نوع من التعلم الآلي حيث تتعلم الوكلاء اتخاذ القرارات من خلال التفاعل مع البيئة لتحقيق أقصى قدر من المكافآت التراكمية. يغطي مفاهيم رئيسية مثل عملية اتخاذ القرار ماركوف، تحسين السياسة، والطرق القائمة على القيم، بالإضافة إلى تطبيقات في مجالات مثل الألعاب، الروبوتات، والأنظمة المستقلة.

Portal > الذكاء الاصطناعي > التعلم المعزز

منشئ المناهج الدراسية

ساتون ، ريتشارد س. ، وأندرو جي بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2018.

كوشينديرفر ، ميكيل ج. ، تيم أ. ويلر ، وكايل إتش راي. خوارزميات لاتخاذ القرار. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2022.

أغاروال ، أليخ ، نان جيانغ ، و S. Kakade. “التعلم المعزز: النظرية والخوارزميات” ، 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

بيرتسيكاس ، ديميتري ب. التعلم المعزز والتحكم الأمثل. 2nd الطباعة (بما في ذلك المراجعات التحريرية). بلمونت ، ماساتشوستس: أثينا العلمية ، 2019.

Thank you for signing up to our newsletter!

Thank you! RSVP received for ساتون ، ريتشارد س. ، وأندرو جي بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2018.

Thank you for applying! We will be in touch.

Apply for: ساتون ، ريتشارد س. ، وأندرو جي بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2018.

ساتون ، ريتشارد س. ، وأندرو جي بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج ، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا ، 2018.

جاري التحميل...

جاري التحميل…