Comprender los valores guardados en el archivo WAVE

7

Los valores que uno puede encontrar en un archivo wave, por ejemplo

    0.0036
    0.0026
    0.0174
    0.0050
    0.0026
    0.0108
    0.0154
   -0.0114
   -0.0006
    0.0115

son, como supongo, valores relativos entre -1 y 1, el rango que normalmente ve cuando mira una forma de onda en algún programa de edición de audio. Ahora, ¿cómo se asignan estos valores relativos cuando reproduce un archivo? Por ejemplo, si hay un valor de 0.5, ¿significa reproducción a la mitad del volumen máximo posible? ¿Hay algún tipo de valor de referencia almacenado en el archivo WAVE al que se refieren los valores relativos?

Otra cosa: en el ejemplo anterior hay 7 valores positivos seguidos de 2 valores negativos. Entonces, la membrana que vibra en un altavoz para crear el sonido se presiona más tiempo en una dirección que en la otra dirección, ¿o cómo se debe interpretar esto? Los valores positivos son una dirección de la vibración y los negativos son vibraciones en otra dirección o ¿estoy equivocado sobre esto?

Muchas gracias :-)

stefan.at.wpf
fuente

Respuestas:

7

Lo que ves son muestras en el dominio del tiempo que corresponden al desplazamiento de un hablante desde alguna posición de descanso en función del tiempo. Por ejemplo, la primera muestra corresponde a la posición de la membrana en , la siguiente representa su posición en , y así sucesivamente, suponiendo que haya segundos entre las muestras. Los intervalos de muestreo comunes para audio incluyen segundos y segundos.t=0t=TTT=18000T=144100

Para convertir un flujo de muestras en audio real, primero se usa un convertidor digital a analógico (DAC) para generar un voltaje analógico variable en el tiempo que corresponde a las muestras. Este voltaje analógico se aplicaría a la entrada de un amplificador de potencia que impulsa el altavoz. El altavoz está diseñado de tal manera que la posición de su membrana varía proporcionalmente al voltaje de entrada del altavoz. Al final de esta cadena, entonces, tiene una membrana de altavoz que se mueve de acuerdo con las muestras de audio originales, produciendo el audio deseado a través de sus vibraciones.

Como notó, los valores de la muestra están normalizados a un rango de . El volumen resultante del audio puede verse afectado por muchos factores no digitales, como la ganancia del amplificador que activa el altavoz o el rango de voltaje de salida del DAC. Los valores máximos de la muestra solo corresponden al "desplazamiento máximo de membrana que puede generar el hardware". Por lo tanto, no hay forma de codificar el volumen absoluto del audio en tal flujo de muestras, de ahí el uso de dicho esquema de normalización.±1±1

Jason R
fuente
2

Cuando reproduce un archivo de audio, el dispositivo normalmente tiene algún tipo de control de volumen. Entonces 0.5 sería relativo a algún volumen máximo permitido por la configuración actual de ese control de volumen.

Además, la ruta de las muestras al altavoz tiene una respuesta de frecuencia (que probablemente no será plana de CC a luz) que modificará el desplazamiento real del altavoz de los valores de las muestras de onda escalada. Dado que la respuesta de frecuencia de la mayoría de los sistemas de audio no pasa CC, la respuesta del altavoz probablemente eliminará cualquier compensación de CC y equilibrará los desplazamientos físicos positivos y negativos reales durante períodos de tiempo suficientemente largos.

hotpaw2
fuente