Preguntas etiquetadas con lstm

Una memoria a corto y largo plazo (LSTM) es una arquitectura de red neuronal que contiene bloques NN recurrentes que pueden recordar un valor durante un período de tiempo arbitrario.

35
¿Cómo evita LSTM el problema del gradiente de fuga?

El LSTM se inventó específicamente para evitar el problema del gradiente de fuga. Se supone que debe hacer eso con el carrusel de error constante (CEC), que en el diagrama a continuación (de Greff et al. ) Corresponde al bucle alrededor de la celda . (fuente: deeplearning4j.org ) Y entiendo que...

20
Diferencia entre retroalimentación RNN y LSTM / GRU

Estoy tratando de entender las diferentes arquitecturas de redes neuronales recurrentes (RNN) que se aplicarán a los datos de series temporales y me estoy confundiendo un poco con los diferentes nombres que se usan con frecuencia al describir los RNN. ¿Es la estructura de la memoria a corto plazo...

15
RNN: ¿Cuándo aplicar BPTT y / o actualizar pesos?

Estoy tratando de comprender la aplicación de alto nivel de los RNN para el etiquetado de secuencias a través (entre otros) del documento de Graves de 2005 sobre la clasificación de fonemas. Para resumir el problema: tenemos un gran conjunto de capacitación que consta de archivos de audio (de...