Preguntas etiquetadas con audio

8
Algoritmo de comparación de voz para calificar similitudes

Estoy tratando de comparar 2 muestras de voz y calificarlas en similitudes. Piense en alguien que intenta repetir una frase y luego compara esos 2 archivos de audio. Comencé implementando el algoritmo MFCC (http://en.wikipedia.org/wiki/Mel-frequency_cepstrum). Calculo los MFCC de ambas muestras de...

8
Detección de tono de piano

Estoy trabajando en un programa de afinación de piano y parte de él requiere detección de tono en tiempo real. Aquí está el esquema que tengo hasta ahora, que funciona hasta cierto punto, pero probablemente podría usar algún refinamiento. Estoy capturando audio PCM mono de 44.1 kHz y 16 bits en...

8
Normalización de audio.

Tengo una grabación en formato pcm y quiero hacer un análisis simple. Tengo algunas preguntas sobre qué es la normalización. Según tengo entendido, es obtener todas las amplitudes entre un rango, es decir, [-1, 1] La forma obvia de hacerlo es: max_amplitude = max(array_of_amplitudes) for...

7
Volumen de la transmisión PCM

Estoy recibiendo muestras de PCM a través de la transmisión, que es un canal, 8000 muestras por segundo. Descubrí la forma de descubrir el volumen calculando la 'fuerza' de la señal agregando el valor de abs de cada 1000 muestras siguientes y luego dividiendo por el recuento de muestras que es...

7
Altas frecuencias de audio en la transmisión de televisión.

Me gustaría saber si en la transmisión de televisión se transmiten frecuencias de audio de alta gama, por ejemplo, frecuencias superiores a 14 kHz. ¿Cuál es la frecuencia de audio cortada de transmisión en la transmisión de televisión? Estoy preparando un informe (para investigación) que...

7
¿Cómo se relacionan los Phons con el volumen?

Digamos que tengo la misma señal almacenada en 2 .wavarchivos. Y digamos que proceso cada archivo usando una función, y se establece que un archivo es 20 phons más grande que el otro. Vamos a ignorar cómo esa función calcula esto. ¿Significa esto que un archivo es aproximadamente 4 veces más...

7
¿Cómo mezclar dos señales sin cambiar el volumen general?

Tengo dos señales de audio que quiero mezclar en varias relaciones de mezcla. Inicialmente, simplemente fui por algo como y(t)=α⋅x1(t)+(1−α)⋅x2(t)y(t)=α⋅x1(t)+(1−α)⋅x2(t)y(t) = \alpha \cdot x_1(t) + (1-\alpha) \cdot x_2(t) dónde αα\alpha es la relación entre cero y uno y x1x1x_1 y x2x2x_2 Son las...

7
Discrepancia de decodificación de MP3

¿Es posible que dos decodificadores diferentes generen dos resultados de muestra diferentes para el mismo MP3? Estoy decodificando un mp3 en Matlab y produce dos columnas (presumiblemente una para cada canal). Cuando extraigo los datos de muestra del mismo archivo usando AVAssetReader (iOS),...

7
Detectando cambios entre voz y música

Tengo un montón de archivos de audio que tienen partes de voz y música (piense en la radio). Por ejemplo, un archivo dado puede constar de las siguientes secciones: music --- speech --- music --- speech --- music --- speech --- music Mi objetivo es detectar cuándo el archivo cambia entre música...

7
Comprender los valores guardados en el archivo WAVE

Los valores que uno puede encontrar en un archivo wave, por ejemplo 0.0036 0.0026 0.0174 0.0050 0.0026 0.0108 0.0154 -0.0114 -0.0006 0.0115 son, como supongo, valores relativos entre -1 y 1, el rango que normalmente ve cuando mira una forma de onda en algún programa de edición de...

7
Requisitos previos para el procesamiento de señales de audio

Comencé un curso de DSP en línea y descubrí rápidamente que, aunque algunas personas dicen que es posible evitar las matemáticas más avanzadas del procesamiento de señales, este no parece ser el caso. Parece que se necesita una comprensión sólida del cálculo y la teoría de la probabilidad para...