¿Puedes representar una señal de audio en otros dominios además del tiempo y la frecuencia?

8

Tal vez sea una pregunta estúpida, pero si hay una representación en el dominio del tiempo de la señal de audio, y también en el dominio de la frecuencia, entonces ¿hay algún otro dominio en el que se pueda representar esa señal?

apocalipsis
fuente
3
Cepstrum es muy útil para algunas aplicaciones.
Serge

Respuestas:

8

El audio solo existe realmente en el dominio del tiempo, en audio lo traducimos a la suma de la onda sinusoidal porque está relacionado con la forma en que escuchamos los sonidos. Hay otras formas de interpretar los sonidos, todo depende de si esa representación es útil para usted. Recuerdo haber leído sobre algo que funciona representando el sonido, una especie de síntesis granular donde cada gránulo estaba hecho de la serie armónica natural, creo que se llamó síntesis resonante.

Nathan Day
fuente
13

Básicamente se trata de dividir la información en varios 'bits'. La señal de audio real es un "valor" variable en el tiempo, sin embargo, a menudo es útil considerarlo de una forma diferente. Como analogía, considere el número 256: dependiendo de lo que esté haciendo con sus números, podría ser útil tratar el número como 200 + 50 + 6, o 16 + 240, o 16*16, o tal vez como 2^8; Hay un número infinito de formas de tratar el número, y cuál usa depende de lo que está tratando de lograr.

La 'representación del dominio de frecuencia' es un ejemplo de hacer el desglose anterior, pero con una señal en lugar de un número. En este caso, está representando la señal original como una suma de sinusoides, todas con diferentes frecuencias, amplitudes y fases. Si los agrega todos juntos, recupera su señal original. Alternativamente, podría optar por representarlo de una manera diferente, como con wavelets, o cualquier otro enfoque que pueda o no tener un nombre (todavía), si es útil para lo que le está haciendo. Tal vez podría dividirlo en fragmentos de 3 segundos, luego reorganizar la señal en cada uno de esos fragmentos para aumentar de manera monotónica, y recordar cómo los reordenó. Esto suena un poco ridículo, pero hay un enfoque para manipular imágenes de resonancia magnética con este tipo de reordenamiento (no usa la parte fragmentada,

Una ventaja de los sinusoides es que, como dice Nathan Day, se relaciona con la forma en que nuestros oídos interpretan el tono de los sonidos. Pero una razón más importante es que los sinusoides son exponenciales complejos, que son funciones propias de sistemas lineales; es decir que los sistemas lineales son mucho más simples de analizar si considera las entradas y salidas como sumas de sinusoides. Esa es la razón principal por la cual el análisis de Fourier es tan extendido e importante.

Respuesta corta a su pregunta: hay un número infinito de dominios en los que puede representar una señal de audio. Para otro popular, vea wavelets.

lxop
fuente