Estoy trabajando con un gran conjunto de datos de acelerómetro recopilados con múltiples sensores usados por muchos sujetos. Desafortunadamente, nadie aquí parece conocer las especificaciones técnicas de los dispositivos y no creo que hayan sido recalibrados. No tengo mucha información sobre los dispositivos. Estoy trabajando en mi tesis de maestría, los acelerómetros fueron prestados de otra universidad y, en general, la situación era un poco intransparente. Entonces, ¿preprocesamiento a bordo del dispositivo? Ninguna pista.
Lo que sí sé es que son acelerómetros triaxiales con una frecuencia de muestreo de 20Hz; digital y presumiblemente MEMS. Estoy interesado en el comportamiento no verbal y los gestos, que según mis fuentes deberían producir principalmente actividad en el rango de 0.3-3.5Hz.
La normalización de los datos parece bastante necesaria, pero no estoy seguro de qué usar. Una gran parte de los datos está cerca de los valores de reposo (valores brutos de ~ 1000, por gravedad), pero hay algunos extremos como hasta 8000 en algunos registros, o incluso 29000 en otros. Ver la imagen de abajo . Creo que esto hace que sea una mala idea dividir por max o stdev para normalizar.
¿Cuál es el enfoque habitual en un caso como este? Dividir por la mediana? ¿Un valor percentil? ¿Algo más?
Como cuestión secundaria, tampoco estoy seguro de si debería recortar los valores extremos.
Gracias por cualquier consejo!
Editar : Aquí hay una gráfica de aproximadamente 16 minutos de datos (20000 muestras), para darle una idea de cómo se distribuyen típicamente los datos.
fuente
Respuestas:
Las señales sin procesar que muestra arriba parecen no estar filtradas ni calibradas. El filtrado y la calibración apropiados , con cierto rechazo de artefactos , normalizarán los datos. El enfoque estándar con datos de acelerómetro es el siguiente:
Es recomendable realizar el rechazo de artefactos en los datos del sensor inercial. Me preocuparía que no conozca la procedencia de los datos, por lo que no puede garantizar que los sensores se hayan colocado correctamente y de manera consistente (en términos de orientación y ubicación física) a todos los sujetos. Si los sensores no se colocaron correctamente, puede obtener una gran cantidad de artefactos en las señales, ya que el sensor puede moverse en relación con el segmento del cuerpo. Del mismo modo, si los sensores estuvieran orientados de manera diferente (en la forma en que fueron colocados) en diferentes sujetos, los datos serán difíciles de comparar entre sujetos.
Dado el tamaño de los valores atípicos que informa, parece probable que sean artefactos. Dichos artefactos sesgarían casi con certeza cualquier cálculo de calibración (aunque su efecto se reducirá mediante un filtrado apropiado) y, por lo tanto, la calibración debe realizarse después del rechazo de artefactos.
Un umbral simple puede funcionar bien para una rutina inicial de rechazo de artefactos, es decir, eliminar (o reemplazar con
NaN
) todas las muestras por encima de cierto umbral empírico. Técnicas más sofisticadas calcularán adaptativamente este umbral utilizando una media móvil o una ventana móvil.Dependiendo de la ubicación del sensor, es posible que también desee corregir la influencia de la gravedad en las señales de aceleración, aunque la comprensión detallada de los ejes y la posición del sensor es crucial aquí. El método Moe-Nillson ( R. Moe-Nilssen, Un nuevo método para evaluar el control motor en marcha en condiciones ambientales de la vida real. Parte 1: El instrumento, Clinical Biomechanics, Volumen 13, Temas 4–5, junio – julio de 1998, Páginas 320-327 ) es la más utilizada y funciona bien para sensores inerciales montados en la parte inferior de la espalda.
Un buen lugar para comenzar a examinar los datos para el reconocimiento de gestos sería dividir los datos filtrados y calibrados en épocas (por ejemplo, 10s) y calcular una serie de características por época y relacionarlas con las etiquetas que tiene para los datos, puedo ' Ofrecer consejos más específicos sin saber más sobre el conjunto de datos y las etiquetas asociadas.
Espero que esto ayude.
fuente