Todas las funciones comunes de ventana no rectangular parecen ser simétricas. ¿Hay algún caso en el que uno quiera usar una función de ventana no simétrica antes de una FFT? (Digamos si los datos en un lado de la apertura FFT se consideraron un poco más importantes que los datos en el otro, o menos ruidosos, etc.)
Si es así, ¿qué tipos de funciones de ventana asimétrica se han estudiado y cómo afectarían a la respuesta de frecuencia en comparación con una ventana simétrica de compensación (¿más pérdida?)?
fft
fourier-transform
window-functions
hotpaw2
fuente
fuente
Respuestas:
Usaré la ventana abreviada para "función de ventana".
Con el audio, cualquier procesamiento que cree algo parecido a un sonido previo o un eco previo sonará como un mp3 de baja velocidad de bits. Esto sucede cuando la energía localizada de un transitorio o un impulso se propaga hacia atrás en el tiempo, por ejemplo, mediante la modificación de los datos espectrales en transformaciones superpuestas, como la transformada discreta de coseno modificada (MDCT). En dicho procesamiento, el audio se abre mediante ventanas de análisis superpuestas , se transforma, se procesa en el dominio de frecuencia (como datos comprimidos a una tasa de bits más pequeña), se vuelve a abrir con una ventana de síntesis y se vuelven a resumir. El producto de la ventana de análisis y síntesis debe ser tal que las ventanas superpuestas sumen unidad.
Tradicionalmente, las funciones de ventana utilizadas han sido simétricas, y su ancho ha sido un compromiso entre la selectividad de frecuencia (ventana larga) y la evitación de artefactos en el dominio del tiempo (ventana corta). Cuanto más amplia sea la ventana, más tiempo atrás el procesamiento puede difundir la señal. Una solución más reciente es usar una ventana asimétrica. Las dos ventanas utilizadas pueden ser imágenes especulares entre sí. La ventana de análisis cae de pico a cero rápido para que los impulsos no se "detecten" con mucha anticipación, y la ventana de síntesis se eleva de cero a pico rápido, de modo que los efectos de cualquier procesamiento no se extiendan mucho hacia atrás en el tiempo. Otra ventaja de esto es la baja latencia. Las ventanas asimétricas pueden tener una buena selectividad de frecuencia y pueden reemplazar ventanas simétricas de tamaño variable en la compresión de audio, como una especie de remedio. VerM. Schnell, M. Schmidt, M. Jander, T. Albert, R. Geiger, V. Ruoppila, P. Ekstrand, M. Lutzky, B. Grill, “MPEG-4 Enhanced Low Delay AAC - un nuevo estándar para alto comunicación de calidad ” , 125a Convención AES, San Francisco, CA, EE. UU., preprint 7503, octubre de 2008 y otro documento de conferencia donde muestran también la magnitud de la transformación de Fourier de su ventana: Schnell, M., et al. 2007. Mejorado MPEG-4 Low Delay AAC - Baja tasa de bits de comunicación de alta calidad. En 122º Convenio AES .
Figura 1. Ilustración del uso de ventanas asimétricas en análisis-procesamiento-síntesis solapada. El producto (trazo negro) de la ventana de análisis (azul) y la ventana de síntesis (naranja amarillento) se unen con la ventana del cuadro anterior (trazo gris). Se necesitan más restricciones para garantizar una reconstrucción perfecta cuando se usa MDCT.
La transformada discreta de Fourier (DFT, FFT) podría usarse en lugar de MDCT, pero en tales contextos dará datos espectrales redundantes. En comparación con DFT, MDCT proporciona solo la mitad de los datos espectrales y, al mismo tiempo, permite una reconstrucción perfecta si se eligen ventanas adecuadas.
Aquí está mi propio diseño de ventana asimétrica (Fig. 2) adecuado para análisis-procesamiento-síntesis lapeado usando DFT pero no MDCT con el que no proporciona una reconstrucción perfecta. La ventana intenta minimizar el producto del ancho de banda del tiempo cuadrado medio y la frecuencia (de manera similar a la ventana gaussiana confinada ) al tiempo que conserva algunas propiedades de dominio del tiempo potencialmente útiles: no negativas, unimodales con el pico en el "tiempo cero" en torno al cual el análisis y la síntesis Las ventanas son imágenes especulares entre sí, función y continuidad de la primera derivada, media cero cuando el cuadrado de la función de ventana se interpreta como una función de densidad de probabilidad no normalizada. La ventana se optimizó utilizando la evolución diferencial .
Figura 2. Izquierda: una ventana de análisis asimétrico adecuada para la superposición de análisis, procesamiento y superposición junto con su ventana de síntesis de contraparte inversa. Derecha: ventana de coseno, con la misma latencia que la ventana asimétrica
Figura 3. Magnitud de las transformadas de Fourier de la ventana del coseno (azul) y la ventana asimétrica (naranja) de la Fig. 2. La ventana asimétrica muestra una mejor selectividad de frecuencia.
Aquí está el código fuente de Octave para las parcelas y para la ventana asimétrica. El código de trazado proviene de Wikimedia Commons . En Linux te recomiendo instalar
gnuplot
,epstool
,pstoedit
,transfig
primero, ylibrsvg2-bin
para su visualización utilizandodisplay
.Es posible que desee utilizar solo cada segunda muestra de la ventana porque comienza y termina en cero. El siguiente código de C ++ lo hace por usted para que no obtenga ninguna muestra de cero, excepto en un cuarto de la ventana que es cero en todas partes. Para la ventana de análisis, este es el primer trimestre y para la ventana de síntesis, este es el último trimestre. La segunda mitad de la ventana de análisis debe estar alineada con la primera mitad de la ventana de síntesis para el cálculo de su producto. El código también prueba la media de la ventana (como una función de densidad de probabilidad) y muestra la planitud de la reconstrucción superpuesta.
Y el código fuente para la función de costo de optimización que se utilizará con Kiss FFT y una biblioteca de optimización :
fuente
Depende del contexto de la ventana. Windowing, como se desarrolló tradicionalmente, estaba destinado al método Blackman-Tukey de densidad espectral de potencia de estimación. Esta es la forma general de los métodos de correlograma, mediante el cual se aprovecha el teorema de Wiener-Khinchin de tiempo discreto. Recuerde que esto relaciona la secuencia de autocorrelación con la densidad espectral de potencia a través de la transformada de Fourier de tiempo discreto.
Por lo tanto, las ventanas fueron diseñadas con varios criterios en mente. Primero, tenían que tener ganancia de unidad en el origen. Esto era para preservar la potencia en la secuencia de autocorrelación de la señal, ya que rxx [0] puede considerarse como la potencia de la muestra. A continuación, la ventana debe reducirse desde el origen. Esto es por varias razones. Primero, para ser una secuencia de autocorrelación válida, todos los otros retrasos deben ser menores o iguales que el origen. En segundo lugar, esto permitió una mayor ponderación de los rezagos más bajos, que se han calculado con gran confianza utilizando la mayoría de las muestras, y una ponderación pequeña o nula de los rezagos más altos, que tienen una variación creciente debido a la disminución de la cantidad de muestras de datos disponibles para su cálculo. Esto finalmente resulta en un lóbulo principal más amplio y, posteriormente, una resolución disminuida en la estimación de PSD,
Finalmente, también es muy deseable si las ventanas tienen un espectro no negativo. Esto se debe a que con el método Blackman-Tukey, puede pensar en el sesgo de la estimación final como la densidad espectral de potencia real convolucionada con el espectro de la ventana. Si este espectro de ventana tiene regiones negativas, es posible tener regiones negativas en su estimación de densidad espectral de potencia. Obviamente, esto no es deseado, ya que tiene poco significado físico en este contexto. Además, notará que no hay una operación de magnitud al cuadrado en el método Blackman-Tukey. Esto se debe a que, con una secuencia de autocorrelación real e incluso multiplicada por una ventana real e incluso, la transformada discreta de Fourier también será real e incluso. En la práctica, encontrará componentes negativos muy pequeños que generalmente se cuantifican.
Por estas razones, las ventanas también tienen una longitud extraña porque todas las secuencias de autocorrelación válidas también lo son. Ahora, lo que aún se puede hacer (y se hace) es la ventana en el contexto de los métodos del periodograma. Es decir, coloque en una ventana los datos y luego tome la magnitud al cuadrado de los datos en ventana. Esto no es equivalente al método Blackman-Tukey. Puede encontrar, a través de algunas derivaciones estadísticas, que se comportan de manera similar en promedio , pero no en general. Por ejemplo, es bastante común usar ventanas para cada segmento en el método de Welch o Bartlett para disminuir la varianza de las estimaciones. Entonces, en esencia, con estos métodos, la motivación es en parte la misma, pero diferente. La potencia se normaliza en estos métodos dividiendo la energía de la ventana, por ejemplo, en lugar de ponderar cuidadosamente los rezagos de la ventana.
Entonces, con suerte, esto contextualiza las ventanas y sus orígenes, y por qué son simétricas. Si tiene curiosidad acerca de por qué uno puede elegir una ventana asimétrica, considere las implicaciones de la propiedad de dualidad de la transformada de Fourier y lo que implica su estimación de densidad espectral de potencia para su aplicación. Salud.
fuente
El punto original de la ventana es asegurarse de que la señal (asumida periódicamente por el DFT) no tenga transitorios agudos al principio en comparación con el final. El costo es que las frecuencias hacia el centro de la ventana (simétrica) estarán más ponderadas y representadas en el DFT posterior.
Con todo eso en el fondo, me imagino que uno querría usar una ventana asimétrica para acentuar las características temporales locales en la señal que se analiza a través del DFT. Sin embargo, esto podría tener el costo de un ancho de lóbulo más amplio durante DFT, si los puntos finales de su señal no tienen aproximadamente la misma amplitud después de la ventana.
fuente