¿Por qué no ve capas de abandono en ejemplos de aprendizaje de refuerzo?
He estado buscando aprendizaje de refuerzo y específicamente jugando con la creación de mis propios entornos para usar con OpenAI Gym AI. Estoy usando agentes del proyecto stable_baselines para probar con él. Una cosa que he notado en prácticamente todos los ejemplos de RL es que nunca parece...