¿Qué es el aprendizaje por refuerzo (RL)?
Tipo de aprendizaje automático en el que un agente aprende por ensayo y error interactuando con un entorno y recibiendo recompensas o penalizaciones por sus acciones.
Tipo de aprendizaje automático en el que un agente aprende por ensayo y error interactuando con un entorno y recibiendo recompensas o penalizaciones por sus acciones.