Me pregunto por qué el entrenamiento de RNN generalmente no usa el 100% de la GPU.
Por ejemplo, si ejecuto este punto de referencia RNN en un Maxwell Titan X en Ubuntu 14.04.4 LTS x64, la utilización de la GPU es inferior al 90%:
El punto de referencia se lanzó con el comando:
python rnn.py -n 'fastlstm' -l 1024 -s 30 -b 128
¿Cómo puedo diagnosticar cuál es el cuello de botella?
fuente