¿Cuál es la complejidad del tiempo para entrenar una red neuronal usando la retropropagación?

Supongamos que un NN contiene nnn capas ocultas, mmm ejemplos de entrenamiento, xxx características yn inin_i nodos en cada capa. ¿Cuál es la complejidad del tiempo para entrenar a este NN utilizando la propagación inversa? Tengo una idea básica sobre cómo encuentran la complejidad temporal de los...