Técnicas para el aprendizaje incremental en línea del clasificador en datos de flujo

9

¿Cuáles pueden ser buenas técnicas para enfrentar este problema abstracto?

Tiene un flujo de datos de una señal continua, como uno de un sensor físico. Esa señal tiene valores reales (discretizados), sin atributo; Se pueden extraer características adictivas (p. ej., potencia, autocorrelación, entropía). Puede asignar una etiqueta de un conjunto finito a una ventana de la señal. Deje que esta etiqueta sea una etiqueta de entrenamiento . Debe elegir los puntos de inicio y finalización de la ventana, así como la etiqueta de la ventana.

La tarea es clasificar las siguientes ventanas en línea, tal como se recibe la señal.

Estoy pidiendo un algoritmo incremental, en el sentido de que debería aumentar su rendimiento de detección con más etiquetas de entrenamiento. Pero debe poder clasificar incluso después de una sola etiqueta de entrenamiento.

Si el problema resulta ser demasiado difícil debido a la detección de límites de ventanas, supongamos que puede corregir su tamaño en una constante pequeña. Por lo tanto, el algoritmo clasifica pequeñas porciones de la señal y luego combina las adyacentes con las mismas etiquetas. Si utiliza ese enfoque simplificado, justifique por qué es razonable.

stackovergio
fuente

Respuestas:

2

Si este es un problema de clasificación binaria, entonces debería ser posible aplicar un SVM en línea como Bordes, A. y Bottou, L. , "The Huller: un SVM en línea simple y eficiente", ECML 2005 .

Si se trata de una clasificación no binaria (es decir, más de 2 etiquetas posibles), puede analizar las técnicas de mínimos cuadrados recursivos del núcleo. Están hechos para la regresión en línea, pero también funcionan bastante bien para la clasificación en línea. Aquí hay un algoritmo básico de KRLS: Y. Engel, S. Mannor y R. Meir , "El algoritmo de mínimos cuadrados de recuperación del núcleo", IEEE Trans. Procesamiento de señal, 2004 .

Ambos enfoques requerirán tamaños de ventana fijos para comparar los vectores de entrada del mismo tamaño.

Steven
fuente