¿Cuántos parámetros tiene un único LSTM apilado? El número de parámetros impone un límite inferior en el número de ejemplos de entrenamiento requeridos y también influye en el tiempo de entrenamiento. Por lo tanto, conocer el número de parámetros es útil para entrenar modelos que usan LSTM.
deep-learning
rnn
wabbit
fuente
fuente
Siguiendo las respuestas anteriores, el número de parámetros de LSTM, tomando vectores de entrada de tamaño dando vectores de salida de tamaño es:m n
Sin embargo, en caso de que su LSTM incluya vectores de sesgo ( este es el valor predeterminado en keras, por ejemplo ), el número se convierte en:
fuente
De acuerdo a esto :
Estructura celular LSTM
Ecuaciones LSTM
Incorporación de no linealidades
Si la entrada x_t es de tamaño n × 1, y hay d celdas de memoria, entonces el tamaño de cada uno de W ∗ y U ∗ es d × n , y d × d resp. El tamaño de W será entonces 4d × (n + d) . Tenga en cuenta que cada una de las celdas de memoria dd tiene sus propios pesos W ∗ y U ∗ , y que el único momento en que los valores de las celdas de memoria se comparten con otras unidades LSTM es durante el producto con U ∗ .
Gracias a Arun Mallya por su excelente presentación.
fuente