¿Cómo puedo clasificar automáticamente los picos de las señales medidas en diferentes posiciones?

10

Tengo micrófonos que miden el sonido a lo largo del tiempo en muchas posiciones diferentes en el espacio. Todos los sonidos que se graban se originan en la misma posición en el espacio pero debido a las diferentes rutas desde el punto de origen a cada micrófono; la señal será (tiempo) desplazada y distorsionada. El conocimiento a priori se ha utilizado para compensar los cambios de tiempo lo mejor posible, pero todavía existe algún cambio de tiempo en los datos. Cuanto más cercanas son las posiciones de medición, más similares son las señales.

Estoy interesado en clasificar automáticamente los picos. Con esto quiero decir que estoy buscando un algoritmo que "mire" las dos señales de micrófono en la gráfica a continuación y "reconozca" desde la posición y la forma de onda que hay dos sonidos principales e informa sus posiciones de tiempo:

sound 1: sample 17 upper plot, sample 19 lower plot,
sound 2: sample 40 upper plot, sample 38 lower plot

Para hacer esto, estaba planeando hacer una expansión de Chebyshev alrededor de cada pico y usar el vector de los coeficientes de Chebyshev como entrada para un algoritmo de clúster (¿k-medias?).

Como ejemplo, aquí hay partes de las señales de tiempo medidas en dos posiciones cercanas (azul) aproximadas por 5 series de Chebyshev a lo largo de 9 muestras (rojo) alrededor de dos picos (círculos azules): ingrese la descripción de la imagen aquí

Las aproximaciones son bastante buenas :-).

Sin embargo; Los coeficientes de Chebyshev para la gráfica superior son:

Clu = -1.1834   85.4318  -39.1155  -33.6420   31.0028
Cru =-43.0547  -22.7024 -143.3113   11.1709    0.5416

Y los coeficientes de Chebyshev para la gráfica inferior son:

Cll = 13.0926   16.6208  -75.6980  -28.9003    0.0337
Crl =-12.7664   59.0644  -73.2201  -50.2910   11.6775

Me gustaría haber visto Clu ~ = Cll y Cru ~ = Crl, pero este no parece ser el caso :-(.

¿Quizás hay otra base ortogonal que es más adecuada en este caso?

¿Algún consejo sobre cómo proceder (estoy usando Matlab)?

Gracias de antemano por cualquier respuesta!

Andy
fuente
1
Parece que está asumiendo inherentemente que la "forma" del pico, cuando se expresa en el espacio vectorial de los coeficientes polinómicos de Chebyshev, es continua (es decir, un pequeño cambio en la forma de una parte del pico producirá un pequeño cambio en los coeficientes). ¿Tienes razones para creer que este es el caso? Parece que ha elegido su herramienta sin asegurarse de que resuelva el problema en cuestión.
Jason R
Para ser claros, ¿de qué manera estás tratando de "clasificar" los picos? ¿Intenta asociar mediciones de sus diversos sensores que corresponden a picos idénticos? ¿Tiene algún otro medio en el que pueda medir el retraso de tiempo relativo a priori y luego usar esa información para la clasificación?
Jason R
Hola Jason R. He actualizado mi pregunta para aclarar un poco las cosas.
Andy
Realmente estoy tratando de reproducir los pasos en el documento "Interpretación estructural automatizada a través de la clasificación de horizontes sísmicos" (Borgos et al). He tratado de explicar el problema en términos más generales.
Andy
@Andy ¿Puede explicar cómo esos coeficientes corresponden a las líneas rojas que se muestran aquí? No parecen correlacionarse ...
Spacey

Respuestas:

2

Parece que tiene una sola fuente, x [n], y múltiples señales de micrófono . Suponiendo que su ruta de propagación desde la fuente a los micrófonos es razonablemente lineal e invariante en el tiempo, usted simplemente modela la ruta como una función de transferencia. Entonces básicamente tienes dondeyi[n]

yi[n]=hi[n]x[n]
hi[n]es la respuesta al impulso de la función de transferencia desde la fuente al micrófono "i". Estas funciones de transferencia tienen diferentes amplitudes y respuestas de fase. Si son lo suficientemente diferentes, las señales de los micrófonos individuales también serán bastante diferentes y no hay razón para creer que los picos realmente se mostrarán en el mismo lugar. En la mayoría de los entornos acústicos, serán "diferentes" si los micrófonos están separados por más de un cuarto de longitud de onda para las frecuencias de interés (o cuando hay una energía no trivial en el espectro).

Si puede medir las funciones de transferencia, puede filtrar cada señal de micrófono con el inverso de esa función de transferencia. Esto debería hacer que las señales del micrófono sean mucho más similares y reducir el efecto del filtrado.

Una alternativa sería combinar todas las señales de micrófono en un formador de haces que optimice la captación de la fuente pero rechace todo lo demás. Esto también debería proporcionar una versión bastante "limpia" de la señal fuente.

Hilmar
fuente