¿Existen algoritmos de aprendizaje no supervisados ​​para datos secuenciados en el tiempo?

9

Cada observación en mis datos fue recolectada con una diferencia de 0.1 segundos. No lo llamo una serie de tiempo porque no tiene una marca de fecha y hora. En los ejemplos de algoritmos de agrupamiento (que encontré en línea) y PCA, los datos de la muestra tienen 1 observación por caso y no están cronometrados. Pero mis datos tienen cientos de observaciones recolectadas cada 0.1 segundos por vehículo y hay muchos vehículos.

Nota: también he hecho esta pregunta sobre quora.

umair durrani
fuente
1
Por favor, tenga en cuenta el idioma. Tu pregunta no está del todo clara. ¿Qué significa "los datos de la muestra tienen 1 observación por caso y no están cronometrados"?
Kasra Manshaei
1
Estaba hablando de los ejemplos que encontré en los tutoriales en línea. Los datos de muestra que utilizan tienen solo 1 observación por caso / individuo (por ejemplo, cliente, país, etc.). Y esos datos no son series de tiempo.
umair durrani

Respuestas:

7

Lo que tienes es una secuencia de eventos según el tiempo, ¡así que no dudes en llamarla Serie temporal!

La agrupación en series de tiempo tiene 2 significados diferentes:

  1. Segmentación de series de tiempo, es decir, desea segmentar una serie de tiempo individual en diferentes intervalos de tiempo de acuerdo con similitudes internas.
  2. Agrupación de series de tiempo, es decir, tiene varias series de tiempo y desea encontrar diferentes agrupaciones de acuerdo con las similitudes entre ellas.

Supongo que te refieres al segundo y aquí está mi sugerencia:

Tiene muchos vehículos y muchas observaciones por vehículo, es decir, tiene muchos vehículos. Entonces tiene varias matrices (cada vehículo es una matriz) y cada matriz contiene N filas (Nr de observaciones) y T columnas (puntos de tiempo). Una sugerencia podría ser aplicar PCA a cada matriz para reducir la dimensionalidad y observar los datos en el espacio de la PC y ver si hay relaciones significativas entre las diferentes observaciones dentro de una matriz (vehículo) . Luego, puede poner cada observación para todos los vehículos entre sí y hacer una matriz y aplicar PCA para ver las relaciones de una sola observación entre diferentes vehículos.

Si no tiene valores negativos, la factorización matricial se recomienda encarecidamente para la reducción de dimensiones de los datos del formulario matricial.

Otra sugerencia podría ser poner todas las matrices una encima de la otra y construir un tensor N x M x T donde N es el número de vehículos, M es el número de observaciones y T es la secuencia de tiempo y aplicar la descomposición del tensor para ver las relaciones a nivel mundial.

En este documento se muestra un enfoque muy agradable para la agrupación de series temporales en el que la implementación es silenciosa y directa.

¡Espero que haya ayudado!

Buena suerte :)


EDITAR

Como mencionaste, te refieres a la segmentación de series de tiempo. Agrego esto a la respuesta.

La segmentación de series de tiempo es el único problema de agrupamiento que tiene una verdad fundamental para la evaluación. De hecho, considera la distribución generadora detrás de la serie temporal y la analiza. Recomiendo encarecidamente esto , esto , esto , esto , esto y esto donde su problema se estudie exhaustivamente. Especialmente el último y la tesis doctoral.

¡Buena suerte!

Kasra Manshaei
fuente
1
Gracias por una gran respuesta. Mi objetivo, de hecho, es hacer "segmentación de series de tiempo" para cada vehículo en mi conjunto de datos.
umair durrani
1
Estoy estudiando tutoriales sobre descomposición de series temporales. Descubrí que hay formas de descomponerlos en componentes de tendencia, estacionales y cíclicos. Mi serie temporal, sin embargo, son pocos segundos de trayectorias de vehículos. ¿Es posible descomponerlos en diferentes componentes de comportamiento de conducción en función de las tendencias en aceleraciones, velocidades, velocidades de vehículos líderes y aceleraciones dentro de una trayectoria observada?
umair durrani
2
¡Tal vez! para esto es mejor considerar tanto la "descomposición" como la "segmentación". Por ejemplo, si su serie temporal muestra grupos significativos en el espacio de la PC, puede relacionarlos con el comportamiento de conducción. La segmentación también es para detectar diferentes comportamientos de conducción dentro de una serie de tiempo. En resumen, puede usar la segmentación para diferentes segmentos de comportamiento de conducción para un vehículo y técnicas de descomposición para detectar comportamientos de conducción globales en todos los vehículos.
Kasra Manshaei