Aprendizaje por refuerzo

Este módulo explora el aprendizaje por refuerzo, un tipo de aprendizaje automático en el que los agentes aprenden a tomar decisiones interactuando con un entorno para maximizar la recompensa acumulada. Abarca conceptos clave como el proceso de decisión de Markov, la optimización de políticas y los métodos basados en valores, junto con aplicaciones en áreas como los juegos, la robótica y los sistemas autónomos....

Portal > Inteligencia artificial > Aprendizaje por refuerzo

Curriculum Builder

Sutton, Richard S., y Andrew G. Barto. Aprendizaje por refuerzo: An Introduction. Segunda edición. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Kochenderfer, Mykel J., Tim A. Wheeler y Kyle H. Wray. Algoritmos para la toma de decisiones. Cambridge, Massachusetts: The MIT Press, 2022.

Agarwal, Alekh, Nan Jiang y S. Kakade. "Aprendizaje por refuerzo: Teoría y algoritmos", 2019.

https://www.semanticscholar.org/paper/Reinforcement-Learning%3A-Theory-and-Algorithms-Agarwal-Jiang/8ef87e938b53c7f3ffdf47dfc317aa9b82848535

Bertsekas, Dimitri P. Aprendizaje por refuerzo y control óptimo. 2ª impresión (incluye revisiones editoriales). Belmont, Massachusetts: Athena Scientific, 2019.

Gracias por suscribirse a nuestro boletín.

Gracias. RSVP recibido para Sutton, Richard S., y Andrew G. Barto. Reinforcement Learning: An Introduction. Segunda edición. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Sutton, Richard S., y Andrew G. Barto. Aprendizaje por refuerzo: An Introduction. Segunda edición. Adaptive Computation and Machine Learning Series. Cambridge, Massachusetts: The MIT Press, 2018.

Cargando...

Cargando...