Preguntas etiquetadas con reinforcement-learning

Para preguntas relacionadas con el aprendizaje controlado por refuerzo positivo externo o señal de retroalimentación negativa o ambas, donde el aprendizaje y el uso de lo aprendido hasta ahora ocurren simultáneamente.

14
¿Cómo definir estados en el aprendizaje por refuerzo?

Estoy estudiando el aprendizaje por refuerzo y sus variantes. Estoy empezando a comprender cómo funcionan los algoritmos y cómo se aplican a un MDP. Lo que no entiendo es el proceso de definición de los estados del MDP. En la mayoría de los ejemplos y tutoriales, representan algo simple como un...