El estado actual de la técnica en interpolación de señales de audio

11

Tres preguntas:

  1. ¿Cuáles son todas las métricas que se pueden usar para medir la calidad de la interpolación de audio de manera objetiva? (pero también en términos de psicoacústica si es posible)

  2. Según esas métricas, ¿cuál es el estado actual de la técnica en la interpolación de audio?

  3. Supongamos que tuviera que renderizar dos archivos de una secuencia de notas de instrumentos virtuales en dos resoluciones y luego comparar un muestreo ascendente de un archivo con la versión renderizada de alta frecuencia, ¿qué software se podría usar para compararlos objetivamente? - idealmente usando las métricas mencionadas anteriormente

Hasta ahora, desde que he podido reunir, estos muestreadores proporcionan la mejor calidad.

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

Uno de los problemas que parecen tener estos muestreadores es el timbre previo y posterior.

Debo señalar que de interés clave es la reconstrucción de la señal (en la medida en que ese término tenga sentido), por lo que el muestreo es más que la disminución de la resolución.

Editar: La eficiencia del tiempo de interpolación es irrelevante en este contexto.

Saludos cordiales, Los curiosos :-)

Bent Rasmussen
fuente

Respuestas:

5

Con respecto al "problema" que observa con los muestreadores:

Muchos algoritmos de remuestreo utilizan un núcleo de interpolación de polifase de filtro de paso bajo de fase lineal. Un núcleo de interpolación de filtro de fase mínima, a diferencia del núcleo de interpolación de fase lineal (con la misma respuesta de frecuencia), produciría menos pre-timbrado durante el remuestreo a una frecuencia de muestreo más alta, que puede medir objetivamente como menos precisa, pero posiblemente psico- suena acústicamente "mejor" para los humanos.

Aquí hay una nota sobre la creación de filtros de fase mínima para filtrar con potencialmente menos timbres previos: http://www.music.columbia.edu/pipermail/music-dsp/2004-February/059372.html

Además, un filtro de paso bajo diseñado por Remez (Parks-McClellan) puede tener una ondulación periódica clara en el dominio de la frecuencia, lo que también podría producir un impulso previo al anillo en el dominio del tiempo. Por lo tanto, es posible que desee probar un Sinc con ventana, o una derivación de un filtro analógico clásico, para el diseño de filtro de paso bajo (este último generalmente resulta en algo más cercano a la fase mínima) para el kernel de interpolación de remuestreo.

hotpaw2
fuente
Con respecto a su punto sobre los filtros de fase mínima: no estoy seguro acerca de los dos primeros enlaces, pero el SRC de iZotope permite una fase continuamente variable entre mínima y lineal. En las pruebas de audición, a las personas les suele gustar un punto intermedio entre la fase mínima y la fase lineal.
schnarf
Un filtro sinc con ventana no sería necesariamente mejor que un filtro equiripple (diseñado a través del intercambio Remez) con respecto al timbre en el dominio del tiempo. El efecto de llamada se llama fenómeno de Gibbs y se observa cuando limita la banda de una señal que contiene discontinuidades (por ejemplo, una onda cuadrada). No es causado por la ondulación del dominio de frecuencia de un filtro equiripple. El efecto es más notable cuando usa filtros con un corte muy agudo; aumentar el ancho de transición puede mitigarlo un poco.
Jason R
@ Jason R: sinusoide en el dominio del tiempo = impulso en el dominio de la frecuencia, la posición depende de la velocidad de ondulación del sinusoide. Ahora invierta los 2 dominios y ponga una onda sinusoidal en una respuesta de dominio de frecuencia. El impulso entra en el dominio del tiempo, la posición depende de las características de ondulación.
hotpaw2
@ hotpaw2: veo tu analogía. No entendí bien la intención de su término "impulso previo".
Jason R
Además, una ventana suave en el dominio del tiempo reproduce su forma no discontinua alrededor de las discontinuidades en el dominio de la frecuencia por convolución, reduciendo así el sobreimpulso de Gibbs.
hotpaw2
6

Existe una comparación bastante exhaustiva de algoritmos de remuestreo: http://src.infinitewave.ca/

Puedes ver las pruebas que usaron allí. El alias es grande y es fácil de visualizar con un espectrograma de un barrido sinusoidal. También hay una respuesta de alta frecuencia: SRC puede reducir las frecuencias altas además de permitirles causar aliasing. Puede visualizar la respuesta de fase con el gráfico de respuesta de impulso, o con un gráfico de la respuesta de fase.

schnarf
fuente
Sí, conozco este excelente recurso. Solo quería saber todos los parámetros que vale la pena medir cuando se mide el rendimiento de remuestreo (en particular, muestreo ascendente).
Doblado Rasmussen