DeepMind afirma que su red Q profunda (DQN) pudo adaptar continuamente su comportamiento mientras aprendía a jugar 49 juegos de Atari.
Después de aprender todos los juegos con la misma red neuronal, ¿fue el agente capaz de jugarlos todos a niveles 'sobrehumanos' simultáneamente (siempre que se presentara aleatoriamente uno de los juegos) o podría ser bueno solo en un juego a la vez porque cambiaba? requiere un nuevo aprendizaje?
Respuestas:
El cambio requirió un reaprendizaje.
Además, tenga en cuenta que :
y
fuente
El cambio requiere volver a aprender, la red no tenía un solo conjunto de pesos que le permitiera jugar bien a todos los juegos. Esto se debe al catastrófico problema de olvido.
Sin embargo, se ha realizado un trabajo reciente para superar este problema:
"Superar el olvido catastrófico en redes neuronales", 2016
Documento: https://arxiv.org/pdf/1612.00796v1.pdf
fuente