¿Cuándo debo usar Reinforcement Learning vs PID Control?

Al diseñar soluciones a problemas como el Lunar Lander en OpenAIGym , el refuerzo de aprendizaje es un medio tentador para darle al agente el control de acción adecuado para aterrizar con éxito. Pero, ¿en qué casos los algoritmos del sistema de control, como los controladores PID , harían un...