Programar una línea siguiendo al robot con aprendizaje de refuerzo
Estoy considerando programar una línea que siga al robot usando algoritmos de aprendizaje de refuerzo. La pregunta que estoy considerando es cómo puedo hacer que el algoritmo aprenda a navegar por cualquier ruta arbitraria. Después de seguir el Libro de Sutton y Barto para el aprendizaje de...