Leí en algunos lugares que la música se muestrea principalmente a 44,1 kHz, mientras que solo podemos escuchar hasta 20 kHz. Por que
Audio, o en términos de procesamiento de señal, una señal de audio es una representación analógica o digital del sonido, típicamente como un voltaje eléctrico.
Leí en algunos lugares que la música se muestrea principalmente a 44,1 kHz, mientras que solo podemos escuchar hasta 20 kHz. Por que
Tengo que hacer una correlación cruzada de dos archivos de audio para demostrar que son similares. He tomado la FFT de los dos archivos de audio y tengo sus valores de espectro de potencia en matrices separadas. ¿Cómo debo proceder para correlacionarlos y demostrar que son similares? Hay una mejor...
Entiendo que OpenCV es la biblioteca de facto para programar el procesamiento de imágenes en C / C ++; Me pregunto si hay una biblioteca C o C ++ como esa para el procesamiento de audio. Básicamente quiero filtrar ondas sin procesar de un micrófono y analizarlas con algunos algoritmos de...
Me gustaría mezclar dos o más canales de audio PCM (por ejemplo, muestras grabadas) digitalmente de una manera acústicamente fiel, preferiblemente en tiempo casi real (lo que significa poco o ningún adelanto). La forma físicamente "correcta" de hacer esto es sumar las muestras. Sin embargo, cuando...
A continuación se muestra una señal que representa una grabación de alguien hablando. Me gustaría crear una serie de señales de audio más pequeñas basadas en esto. La idea es detectar cuándo comienza y termina el sonido 'importante' y usarlos para los marcadores para crear un nuevo fragmento de...
Estoy estudiando algunos DSP y tengo problemas para entender la diferencia entre el retraso de fase y el retraso de grupo . Me parece que ambos miden el tiempo de retraso de las sinusoides que pasan a través de un filtro. ¿Estoy en lo correcto al pensar esto? Si es así, ¿cómo difieren las dos...
Estaba buscando en la tienda de aplicaciones de Android un afinador de guitarra. Encontré una aplicación de sintonizador que decía que era más rápida que otras aplicaciones. Afirmó que podía encontrar la frecuencia sin usar el DFT (ojalá todavía tuviera la URL para esta especificación). Nunca he...
Dada una grabación, necesito detectar si se ha producido algún recorte. ¿Puedo concluir con seguridad que hubo recorte si alguna (una) muestra alcanza el valor máximo de la muestra, o debería buscar una serie de muestras posteriores al nivel máximo? La grabación se puede tomar de convertidores...
Hace un tiempo estaba intentando diferentes formas de dibujar formas de onda digitales , y una de las cosas que intenté fue, en lugar de la silueta estándar de la envolvente de amplitud, mostrarla más como un osciloscopio. Así es como se ve una onda sinusoidal y cuadrada en un osciloscopio: La...
Esta pregunta se migró de Stack Overflow porque se puede responder en Signal Processing Stack Exchange. Migrado hace 7 años . Puedo escribir un generador de onda sinusoidal básica para audio, pero quiero que sea capaz de hacer una transición suave de una frecuencia a...
He oído que la transformación de Hilbert se puede usar para calcular la envolvente de una señal. ¿Como funciona esto? ¿Y en qué se diferencia este "sobre de Hilbert" del sobre que se obtiene simplemente rectificando una señal? Me interesa específicamente encontrar una manera de calcular una...
Los oídos de las personas pueden escuchar sonidos cuyas frecuencias oscilan entre 20 Hz y 20 kHz. Basado en el teorema de Nyquist, la velocidad de grabación debe ser de al menos 40 kHz. ¿Es la razón para elegir 44.1
No sé cómo llamar a estas imágenes, pero a menudo se usan en el mundo del procesamiento de imágenes como ejemplos estándar para mostrar el resultado de una operación en particular. Aquí hay un enlace a la página que describe a Lena como una "imagen de prueba estándar" . ¿Hay clips de audio...
Estoy tratando de implementar un filtro IIR de octavo orden y cada nota de aplicación y libro de texto que he leído dice que es mejor implementar cualquier filtro de orden de más de 2 como secciones de segundo orden. Utilicé tf2sosen MATLAB para obtener los coeficientes para las secciones de...
Tengo un conjunto de canciones para las cuales extraje el espectrograma de magnitud usando una ventana de Hamming con una superposición del 50%. Después de extraer el espectrograma, hice una reducción de dimensionalidad usando el Análisis de Componentes Principales (PCA). Después de reducirlo a una...
Para alguien que tiene cierta experiencia en el desarrollo de software, ama sus sintetizadores y conoce los [muy] básicos de la representación de audio digital, ¿cuáles son los primeros pasos que debe seguir para programar un sintetizador de música,
Sooo .. He estado pensando en estas cosas. Todos sabemos que sonamos diferentes de lo que escuchamos de nuestra propia voz. Es fácil descubrir cómo nos escuchan los demás grabándose y escuchándolo. ¿Pero qué pasa al revés? ¿Hay alguna manera de transformar nuestra voz de manera que otros puedan...
Como seguimiento a mi pregunta anterior, me preguntaba si existen bibliotecas de detección de voz. Por detección de voz me refiero a pasar un búfer de audio y obtener un índice de dónde comienza y se detiene el habla. Entonces, si tengo 10 segundos de muestreo de audio a 44kHz, esperaría una serie...
¿Alguien sabe de un filtro para atenuar la no voz? Estoy escribiendo un software de reconocimiento de voz y me gustaría filtrar todo menos el habla humana. Esto incluiría ruido de fondo, ruido producido por un micrófono sucio o incluso música de fondo. Ya he implementado un filtro de primer orden...
He estado experimentando algunas semanas para encontrar una manera de combinar / encontrar canciones similares en una biblioteca que contenga diferentes géneros de música. Mi primer intento fue detectar características como Tempo o la cantidad de graves que hay en las canciones para formar grupos,...