¿Hay alguna ventaja matemática para tasas de muestreo más altas?

18

Dado que la mayoría de las personas no pueden escuchar tantas frecuencias por encima de 20kHz de todos modos, nunca he entendido los argumentos exactos para usar frecuencias de muestreo superiores a 48kHz. A 48kHz, entiendo que es más fácil construir un filtro de paso bajo con un poco de ancho de banda más alto para eliminar el aliasing, pero no entiendo por qué alguien querría grabar a 96kHz.

Para proyectos que son estrictamente digitales, es decir, que utilizan síntesis digital pura y no registran ningún material que se convertiría de analógico a digital, ¿hay alguna ventaja en utilizar frecuencias de muestreo superiores a 44,1 kHz?

Para todo lo demás, ¿hay algún beneficio en usar 96kHz? ¿Es beneficioso cuando se aplica algún tipo particular de operación DSP más adelante? ¿O es puramente un efecto placebo para el oído?

Nota: Aquí hay otras preguntas sobre las tasas de muestreo que se utilizarán para varios tipos de proyectos de grabación, pero aquí solicito datos reales y sólidos por cualquier razón matemática o relacionada con DSP que respalde el uso de tasas de muestreo más altas.

Nik Reiman
fuente

Respuestas:

19

Siempre uso tasas de muestreo dobles si es posible, por dos razones importantes.

Primera razón: deshacerse de las características del filtro antiimagen cuando se trabaja con fuentes de sonido analógicas. ¿Qué es un filtro antiimagen?

Digamos que estoy grabando en 44100 Hz.
Si registrara una onda sinusoidal de menos de 10 KHz, podría ver claramente la onda sinusoidal cuando traza los valores de la muestra en un gráfico.
Si muestreo una onda sinusoidal de 0dB FS con una frecuencia de 22,5KHz, las muestras leen 1 y -1 alternativamente.

Ahora, aquí está el problema. Si grabo una onda sinusoidal de 0dB FS con una frecuencia de 30 KHz y trazo las muestras, cada muestra tomará más de la mitad de un período sinusoidal y, si reproduce las muestras, devolverá una onda sinusoidal de 11KHz. (Si no me cree, simplemente haga un dibujo simple). Este comportamiento se llama 'efecto de imagen'.

Esto significa que antes de muestrear la señal, debemos asegurarnos de que NO haya frecuencias presentes por encima de la llamada "frecuencia de nyquist" (que es la mitad de la frecuencia de muestreo). Cuando se utilizan fuentes de sonido digital que proporcionan sus sonidos ya muestreados, esto no es realmente un gran problema, ya que a veces solo se pueden programar para que nunca generen una señal por encima de la mitad de la frecuencia de muestreo, o pueden filtrar todo usando una fase lineal filtro de brickwall que no tiene efecto en el resto.

Pero, si está muestreando la señal de una fuente analógica, este filtrado se realiza antes de muestrear la señal. La única forma de filtrar el sonido analógico es mediante el uso de un circuito electrónico. Y dado que se supone que el filtro tiene una curva muy empinada, afectará las frecuencias dentro del rango audible , aunque el filtro no esté diseñado para ello. Ahora hay algunos filtros bastante buenos dentro de los convertidores A / D, por lo que el problema es mínimo, pero se vuelve relativamente irritante escucharlo cuando está trabajando varios días en audio de 44.1 KHz, en comparación con el uso de 96KHz. El filtro que se aplicará cuando vuelva a muestrear 96 a 44.1 es, por supuesto, un filtro digital, y probablemente sea de una calidad mucho mejor. Y, solo se aplica cuando haya terminado por completo con todo el trabajo, por lo que no le molestará.

Segunda razón: deshacerse de las características de la señal de oscilación.

Cuando grabe con una resolución de 24 bits y planee tener su maestro a 16 bits, necesitará una señal de oscilación para enmascarar los errores de redondeo. Ahora, el ruido no es algo agradable en su grabación y, aunque el ruido de banda ancha es mejor para enmascarar los errores de redondeo, la configuración del ruido puede ser una gran mejora aplicada a la señal de oscilación para que sea menos molesta. Ahora, si la grabación se realizó con 96KHz, puede hacer ruido en la mayor parte de la señal de oscilación a frecuencias superiores a 24KHz, para que nadie las escuche. El ruido de interpolación se encuentra al final de la grabación, finalmente se filtró, en el momento en que disminuye la resolución de su proyecto a 44,1 KHz.

Entonces, en pocas palabras: ¿es útil al grabar cosas analógicas?

  • Sí definitivamente. Tiene menos perturbaciones del filtro antiimagen y menos perturbaciones de la señal de oscilación cuando se usa con la formación de ruido adecuada.

¿Es útil cuando trabajo con cosas digitales que salieron de mi softsynth?

  • Sí, sigue siendo útil si planea trabajar con 24 bits y dominarlo hasta 16 bits. Puede ganar mucho con el ruido que da forma a la señal de oscilación.
El Pellmeister
fuente
"dado que a veces solo se pueden programar para que nunca generen una señal por encima de la mitad de la frecuencia de muestreo" Sin embargo, definitivamente es cierto: "o pueden filtrar todo utilizando un filtro de pared lineal que no tiene efecto en el resto" No estoy Claro que es posible. Para filtrar el ultrasonido de una onda generada digitalmente, necesitaría generarlo a una frecuencia de muestreo más alta en primer lugar (lo que aún sería un alias, pero no tanto en la banda audible). No puede filtrar frecuencias que ya tengan alias.
endolito
3
"Ahora, si la grabación se realizó con 96KHz, puede dar forma al ruido de la mayor parte de la señal de interpolación a frecuencias superiores a 24KHz, para que nadie las escuche. El ruido de interpolación se encuentra al final de la grabación finalmente filtrado, en el momento en que disminuye la muestra su proyecto de vuelta a 44.1 KHz ". Tampoco creo que sea correcto. Si filtra todo el dither, entonces su salida ya no tiene dither? ¿Volverá a tener distorsión de cuantización?
endolito
Re primer comentario: Tienes toda la razón. Creo que lo que quise decir es que cuando usas un efecto digital, puedes esperar que se cuide el rango de frecuencia de su salida. Ponlo de esta manera, si la salida sale alias en primer lugar, aumentar tu propia frecuencia de muestra no va a cambiar eso. En cuanto a su segundo comentario: interesante; Depende totalmente de los filtros utilizados antes del muestreo. Si el ruido fuera reflejado, obviamente enmascararía el ruido de cuantización, pero no sonaría exactamente igual. Creo que moldearía mi ruido alrededor de la última frecuencia de nyquist.
The Pellmeister
1
Ciertos tipos de operaciones pueden convertir componentes de frecuencia por encima de 24KHz en componentes de frecuencia por debajo de 20KHz y viceversa. Si el audio no se mantiene a una frecuencia de muestreo más alta entre la primera y la última operación, la pérdida de información en las etapas intermedias puede tener un efecto audible en la salida final.
supercat
12

Para proyectos que son estrictamente digitales, es decir, que utilizan síntesis digital pura y no registran ningún material que se convertiría de analógico a digital, ¿hay alguna ventaja en utilizar frecuencias de muestreo superiores a 44,1 kHz?

Si. Algunos ejemplos:

Creación de frecuencias que no quieres

Aliasing de síntesis digital

Muchos generadores de onda cuadrada / diente de sierra / triángulo están escritos ingenuamente, ya que producen un número infinito de armónicos, que tienen un alias y suenan claramente mal . ( no..., +1, +1, +1, +1, −1, −1, −1, −1, ... es una onda cuadrada correcta, y los armónicos con alias producirán sonidos de sintonización de radio en el fondo durante el portamento).

Si la frecuencia de muestreo es mayor, este efecto se reduce porque la frecuencia de alias está más lejos de la banda de audio.

Por supuesto, sería mejor si el generador se escribiera de una manera que elimine completamente el alias , pero no siempre se puede controlar eso como usuario. Incluso los bien escritos suelen ser compromisos, con alias "reducido" , no completamente limitado en banda, por lo que una tasa de muestreo más alta todavía ayuda.

Alias ​​de distorsión digital

Del mismo modo, cuando utiliza cualquier tipo de distorsión digital no lineal, produce un número infinito de armónicos o productos de intermodulación . Los que se producirían por encima de la frecuencia de Nyquist en realidad están alias nuevamente dentro del rango audible.

Aunque teóricamente es posible distorsionar de forma ilimitada , no es común que los codificadores de complementos hagan esto realmente. Todos los complementos de distorsión de guitarra que he probado tienen alias, incluso el procesamiento a 96 kHz.

No estoy seguro de cuánto problema es esto prácticamente. Muchas cosas causan pequeñas cantidades de distorsión, como un compresor o un desvanecimiento de volumen, pero la cantidad ya es insignificante, por lo que la cantidad con alias es aún más insignificante. Para una fuerte distorsión, las frecuencias con alias también pueden no ser notables porque están enterradas en el ruido. En cualquier caso, una frecuencia de muestreo más alta ayudará a minimizar los efectos nocivos.

La falta de frecuencias que hace falta

Otra posible preocupación es que las frecuencias ultrasónicas sintetizadas pueden ser útiles más adelante en el procesamiento, a pesar de que no puede escucharlas directamente en la grabación:

Cambio de frecuencia por cambios de tiempo

Si vuelve a muestrear una onda para ralentizarla, como en un reproductor de fuente de sonido, esas frecuencias ultrasónicas se convertirán en frecuencias audibles. Si los hubiera filtrado para evitar el alias a la frecuencia de muestreo más baja, el sonido más lento estaría perdiendo el extremo superior.

Distorsión / Modulación

Como se dijo anteriormente, la distorsión creará nuevas frecuencias de intermodulación en las ubicaciones de suma y diferencia de las frecuencias en la grabación original. Esta vez, nos preocupa que se produzcan frecuencias audibles deseables por distorsión / modulación de frecuencias ultrasónicas (no relacionadas con el aliasing). Si esas frecuencias ultrasónicas no están en la grabación antes de la distorsión, a la salida le faltarán las frecuencias audibles que producen, y no emulará exactamente un efecto analógico equivalente.

Nuevamente, no estoy seguro de si esto es prácticamente un problema, pero es al menos plausible, y las tasas de muestreo más altas que incluyen ultrasonido lo mejorarán.

En general, trabajar a velocidades de muestreo más altas proporciona "margen de maniobra" para evitar problemas con efectos y cosas que pueden no implementarse correctamente. Al igual que fotocopiar una fotocopia, cuanto mejor sea la calidad de cada copia, menor será la degradación del producto final.

Inútil para la reproducción

Esto no quiere decir que las frecuencias de muestreo más altas sean una buena idea para la reproducción de la mezcla terminada. Ellos no están. Como se describió anteriormente, la distorsión del ultrasonido puede producir un sonido audible, y los altavoces son lo menos lineal en la cadena de audio, por lo que desea eliminar cualquier ultrasonido de la mezcla final para evitar que el altavoz lo distorsione.

No hay beneficio para las frecuencias de muestreo más altas para la reproducción de música; solo deben usarse en las etapas de grabación y procesamiento. Ver 24/192 Descargas de música ... y por qué no tienen sentido .

endolito
fuente
1
+1 por mencionar generadores de onda cuadrada incorrectos. Además, lo mismo puede decirse de las ondas de diente de sierra y triángulo ...
Nombre para mostrar
El sobremuestreo digital a una velocidad de 96KHz o superior a menudo es útil para la reproducción porque la salida de audio puede mantenerse fácilmente libre de cualquier contenido no deseado en el rango de 22Khz a 48KHz. Construir un filtro analógico para matar cualquier cosa de 48Khz sin dañar nada por debajo de 22Khz es mucho más fácil que construir uno para matar todo por encima de 26Khz sin dañar nada por debajo de 22Khz. Si el audio se convertirá a 96Khz para la reproducción, y uno lo tiene a 96Khz, es mejor mantenerlo a 96Khz en lugar de convertirlo hacia abajo y hacia arriba.
supercat
@supercat Eso es para grabar, no para reproducir. Es fácil hacer un filtro digital súper empinado para eliminar todo lo que esté por encima de 20 kHz antes de la reproducción. Hacer un filtro analógico para eliminar el ultrasonido antes del muestreo es difícil / costoso, razón por la cual los ADC usan sobremuestreo a velocidades mucho más altas (MHz) y luego usan filtros digitales para eliminar el ultrasonido y convertirlo nuevamente a una frecuencia normal como 96 kHz.
endolito
5

Tener margen para los efectos es una razón teórica (y prácticamente) válida para tener una frecuencia de muestreo más alta que el doble del límite de audición humana.

La razón de esto se visualiza fácilmente comparándola con la edición de imágenes: si solo tiene una imagen de 800x600 px con una toma general de una pared de ladrillos de alto contraste, mallas, tejidos a rayas u otra textura de alto contraste finamente espaciada, solo puede rotar Múltiplos de 45 ° sin causar un efecto muaré y difuminar los detalles. Con el audio, las distorsiones que ocurren con la edición tienen diferentes términos, pero se aplican los mismos principios del teorema de muestreo de Nyquist-Shannon. Aliasing es un término más comúnmente usado que "efecto de imagen", para el caso de que el sonido muestreado tenga un contenido de frecuencia superior a la mitad de la frecuencia de muestreo (llamada frecuencia Nyquist).

En la práctica, como ya explicó Pelle ten Cate, no se puede lograr un filtro de paso bajo de pared de ladrillo, pero siempre hay algún gradiente (pendiente) en el corte.

Otra buena razón para grabar con frecuencias de muestreo más altas es lograr una imagen estéreo más precisa, ya que la audición humana en gran parte se basa en pequeñas diferencias de tiempo (aproximadamente 5-20 ms, y físicamente estas son diferencias de fase) entre los oídos para localizar las fuentes de sonido. Las cabezas "sombra" y otros aspectos también juegan un papel importante.

Con una frecuencia de muestreo de CD de audio de 44100 Hz, cada muestra representa 22,6 microsegundos y, por ejemplo, un período de una frecuencia de 882 Hz tiene 50 muestras. Además, un retraso bastante largo de 20 ms demora 50 muestras. Entonces, solo 25 muestras a esa frecuencia media significa una cancelación de fase de 180 °.

Entonces, la frecuencia de muestreo de 44,1 KHz es lo suficientemente buena, pero en realidad no tiene mucho margen para editar.

Otra cosa que debe tenerse en cuenta es usar el tramado (al igual que en la edición de imágenes) para evitar el ruido de cuantización. Y luego preguntarán, ¿debería usar cuantificación de 24 bits en lugar de 16 bits ...?

Peterhil
fuente
¿Se ha demostrado que el ultrasonido todavía tiene un efecto en nuestra percepción estéreo aunque no podamos escucharlo conscientemente?
endolito
1
No, el efecto de las diferencias de tiempo interaural en la imagen estéreo tiene mayor efecto en las frecuencias bajas (por debajo de 1500 Hz), donde la distancia de los oídos es más corta que la longitud de onda, por lo que hay una diferencia de fase. En frecuencias más altas, la diferencia en el nivel de sonido tiene más efecto en la localización del sonido. Ver: en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil
4

Otra buena razón para usar una frecuencia de muestreo más alta es evitar las deficiencias de las implementaciones de complementos. Muchos escritores de complementos no tienen en cuenta adecuadamente los efectos de expansión de ancho de banda de las operaciones de señales no lineales y, como resultado, puede obtener efectos de alias antes de abandonar el cuadro.

Por ejemplo, un compresor es básicamente un amplificador controlado por voltaje ... multiplica una señal (la señal de audio) por otra señal (la ganancia). La multiplicación de 2 señales también se conoce como modulación en anillo o heterodino; tiene el efecto de producir señales de suma y diferencia de las 2 entradas. Si multiplica un seno de 15 kHz por un seno de 10 kHz, obtendrá una señal de salida que tiene un componente de 5 kHz y un componente de 25 kHz. Si la ganancia de su compresor tiene un ataque muy rápido, y la señal de entrada tiene un ancho de banda amplio, la señal del componente "suma" podría superar fácilmente el límite de Fs / 2 de forma transitoria, lo que da como resultado un alias espurias de baja frecuencia en su salida señal.

La solución real para esto es que el complemento se implemente utilizando un sobremuestreo interno, pero si no puede obtener eso, lo mejor es ejecutar el sistema a la F más alta posible. No tendrá ningún contenido de audio real en la estratosfera, pero está protegido contra algún complemento que supere el límite.

Bill Gribble
fuente
2

Por lo que vale, el razonamiento matemático, al menos para las necesidades del mundo del audio, generalmente se describe mediante el teorema de muestreo de Nyquist-Shannon , a veces denominado teorema de Nyquist, que en lenguaje básico simplemente establece que para reproducir completamente forma de onda con una frecuencia máxima n Hz, necesita 2n muestras por segundo.

Marc Bollinger
fuente
1
Sí, pero Nyquist-Shannon usa filtros de ladrillo, que son físicamente imposibles.
endolito
1

Cuando grabo con varias pistas, creo que la profundidad de bits es más importante que la frecuencia de muestreo.

Entonces, por ejemplo, 24 bits sería mejor que 16 bits. Esto tiene que ver con la forma en que sus pistas se mezclan y algo llamado "errores de redondeo" cuando no hay suficientes bits.

La mayoría del hardware y software ahora pueden admitir fácilmente 96k y 24 bits, por lo que no hay una necesidad real de conformarse con menos.

Dicho esto, obviamente puede hacer una grabación de alta calidad utilizando equipos antiguos 16 / 44.1.

Se trata más del talento que del equipo.

Corey
fuente
2
Si bien esto no es 'falso', trabajar con 24 bits presenta el inconveniente de que debe usar el tramado si desea volver a 16 bits. El ruido intermitente se puede reducir enormemente si se aplica a una señal de 96 KHz cuando se usa la configuración de ruido. (ver otra respuesta para más detalles)
The Pellmeister
1
Todo el software de audio profesional funciona internamente con punto flotante de 32 o 64 bits durante la mezcla, independientemente de la profundidad de bits utilizada durante la grabación.
Leftaroundabout
3
@PelletenCate si trabaja con 16 bits, ya está jodido, porque agrega ruido de cuantización en cada paso de edición no trivial. Esto es muy incorrecto al implicar que trabajar con 24 o más bits introduce tal inconveniente.
Nombre para mostrar
Hice +1 en eso. No debería describir eso como un inconveniente, porque no lo es. Sin embargo, debo decir que tanto el ruido de cuantificación como el ruido de oscilación sin forma son audibles en una mezcla 44/16. Mi punto es que al cambiar a 24 bits, tiene la oportunidad de cambiar un problema (ruido de cuantización) por otro (ruido de difuminado) que se puede disminuir efectivamente al grabar en una frecuencia de muestreo más alta.
The Pellmeister
0

"... hechos reales y reales por cualquier razón matemática o relacionada con DSP que respalde el uso de tasas de muestreo más altas".

Los llamados hechos reales provienen de ingenieros de audio reales, existe la posibilidad de encontrar varios aquí, pero es probable que sea más rápido buscar en Internet artículos escritos por ingenieros reales. Preguntar aquí significa que se conforma con nosotros, no soy un ingeniero de audio, pero puedo usar las herramientas de búsqueda.

Algo a considerar es su ruido de fondo. Otras respuestas mencionan cómo podría agregar ruido y mencionan el error de oscilación y cuantificación, pero lo más parecido a cualquier otra respuesta al mencionar el piso fue este dato: "... las frecuencias con alias también pueden no ser notables porque están enterradas en el ruido. ".

Si está grabando en un sitio de construcción, estación de tren o astillero, puede ser barato y grabar a 44.1 si no busca la perfección; de lo contrario, al igual que el video es 4: 2: 2 y no 4: 2: 0, entonces es para Audio más Bits pero no más de 32 (para USTED, internamente en el Software más de 32) y una frecuencia de muestreo más alta pero no más de 96kHz (nuevamente, para usted, utilice internamente Software y Hardware que funciona a una frecuencia de muestreo más alta).

Pruebe estos artículos para comenzar a buscar el consejo del ingeniero: no visitaría legaladvice. stackexchange para información crítica, así que aprende a aprender, en última instancia, es cuánto te importa, cuánto le importa a tu audiencia, tu nivel de habilidad y lo que puedes pagar.

Por qué 88.2 - http://www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

¿Por qué 24/96? - http://www.premiersoundfactory.com/modules/pico/content0035.html

Muchos lugares en Internet, incluidos cursos gratuitos en línea.

La versión corta es sí, hay una razón y es un hecho difícil: no arroje errores al principio y espere recortarlos más tarde, no querrá que alguien hable mientras intenta grabar o extraños corriendo por el Disparo - Sin embargo, hay videos que tienen tanto eso y muchos aprobado.

El truco para recordar es grabar en voz alta sin recortar a las altas tasas que puede pagar (tiempo, espacio de almacenamiento, habilidad, dinero y tipo de entrada (IE: sitio de construcción), audiencia) y cortar los matices más silenciosos con Noise Removal para eliminar el Pésima cuantización y ruido intermitente (que tal vez nunca haya notado hasta que lo mencionamos).

[Escrito con la intención de ser una respuesta simple sin errores de hecho y sin la intención de ofender a los aficionados al audio o ingenieros de audio profesionales]

Robar
fuente