RNN usando múltiples series de tiempo

14

Estoy tratando de crear una red neuronal utilizando series de tiempo como entrada, para entrenarla según el tipo de cada serie. Leí que usando RNNs puedes dividir la entrada en lotes y usar cada punto de la serie de tiempo en neuronas individuales y eventualmente entrenar la red.

Sin embargo, lo que estoy tratando de hacer es usar series de tiempo múltiples como entrada. Entonces, por ejemplo, puede recibir información de dos sensores. (Entonces, dos series de tiempo), pero quiero usar ambas para obtener un resultado final.

Además, no estoy tratando de predecir valores futuros de la serie temporal, estoy tratando de obtener una clasificación basada en todos ellos.

¿Cómo debería abordar este problema?

  • ¿Hay alguna manera de usar series de tiempo múltiples como entrada para un RNN?

  • ¿Debo intentar agregar las series de tiempo en una?

  • ¿O debería usar dos redes neuronales diferentes? Y si este último enfoque es correcto, si el número de series de tiempo aumenta, ¿no sería una computadora demasiado intensiva?

Ploo
fuente

Respuestas:

10

Las series de tiempo multivariadas son un tema de investigación activo en el que encontrará una gran cantidad de artículos recientes que abordan el tema.

Para responder a sus preguntas, puede usar un solo RNN. Puede ingresar un valor para cada paso de tiempo. Nada le impide agregar otro valor en cada paso de tiempo (si su sensor está sincronizado). Su modelo luego aprenderá a clasificar con una serie de tiempo bidimensional.

Revisas este blog . En su caso, solo la salida es diferente.

En cuanto a los dos últimos puntos, agregar la serie de tiempo en uno es arriesgado en el sentido de que podría perder información importante durante el proceso. Finalmente, la principal desventaja de su último punto es que no podrá utilizar una posible correlación entre las dos series de tiempo para la clasificación final.

Daerken
fuente
Si usa varias series de tiempo, ¿cómo reaccionará la red si por alguna razón para la muestra 1 tiene 5 series pero para la muestra 2 tiene 4 (tal vez porque no tiene datos del último sensor)? ¿Es necesario que si comienzas con 5 series, siempre debe ser 5? ¿Debería incluir una quinta serie de tiempo para la muestra2 con datos promedios falsos para obtener los 5?
Ploo
1
Ah, bueno, hay diferentes enfoques para la falta de datos. Le recomendaría que use el valor 0 cuando no tenga valores. A menudo se usa cuando no tenemos toda la secuencia X_t pero aún tenemos que ingresar una secuencia de longitud t. Se llama relleno si desea saber más sobre esto.
Daerken