التعلُّم المعزز

تستكشف هذه الوحدة التعلم المعزز، وهو نوع من التعلم الآلي حيث يتعلم الوكلاء اتخاذ القرارات من خلال التفاعل مع البيئة لتعظيم المكافأة التراكمية. ويغطي مفاهيم رئيسية مثل عملية اتخاذ القرار في ماركوف، وتحسين السياسات، والأساليب القائمة على القيمة، إلى جانب تطبيقات في مجالات مثل الألعاب والروبوتات والأنظمة المستقلة.

البوابة > الذكاء الاصطناعي > التعلُّم المعزز

منشئ المناهج الدراسية

ساتون وريتشارد س. وأندرو ج. بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا، 2018.

كوشندرفر، ومايكل ج.، وتيم أ. ويلر، وكايل إتش. خوارزميات اتخاذ القرار. كامبريدج، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا، 2022.

أغاروال، وأليخ، ونان جيانغ، وس. كاكادي. "التعلم المعزز: النظرية والخوارزميات"، 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

بيرتسيكاس، ديمتري ب. التعلم المعزز والتحكم الأمثل. الطبعة الثانية (بما في ذلك المراجعات التحريرية). بلمونت، ماساتشوستس: أثينا العلمية، 2019.

شكراً لاشتراكك في نشرتنا الإخبارية!

شكراً لكم تم استلام رد على دعوة الحضور لـ ساتون وريتشارد س. وأندرو ج. بارتو التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا، 2018.

ساتون وريتشارد س. وأندرو ج. بارتو. التعلم المعزز: مقدمة. الطبعة الثانية. سلسلة الحوسبة التكيفية والتعلم الآلي. كامبريدج، ماساتشوستس: مطبعة معهد ماساتشوستس للتكنولوجيا، 2018.

جاري التحميل...

جاري التحميل...