Introducción a los algoritmos de aprendizaje por refuerzo
El aprendizaje por refuerzo es un tipo de aprendizaje automático en el que un agente aprende a tomar decisiones realizando acciones en un entorno para maximizar alguna noción de recompensa acumulativa. A diferencia de otros tipos de aprendizaje automático, donde el algoritmo recibe un conjunto de datos etiquetados para aprender, el aprendizaje por refuerzo consiste … Read more