Biblioteca análoga a OpenCV para procesamiento / análisis de audio

50

Entiendo que OpenCV es la biblioteca de facto para programar el procesamiento de imágenes en C / C ++; Me pregunto si hay una biblioteca C o C ++ como esa para el procesamiento de audio. Básicamente quiero filtrar ondas sin procesar de un micrófono y analizarlas con algunos algoritmos de aprendizaje automático. Pero eventualmente también podría necesitar:

Captura de audio multiplataforma y reproducción de audio
DSP - Filtros de audio
Detección de tono
Análisis de propiedad tonal
Síntesis de tono
Reconocimiento dado algún corpus y modelo de reconocimiento
Síntesis de voz / música

Cualquier consejo sería apreciado.

image-processing audio Tae-Sung Shin
fuente

29

Considera lo siguiente:

clam-project.org :

CLAM (Biblioteca C ++ para audio y música) es un marco de software completo para la investigación y el desarrollo de aplicaciones en el dominio de audio y música. Ofrece un modelo conceptual, así como herramientas para el análisis, síntesis y procesamiento de señales de audio.

MARF :

MARF es una plataforma de investigación de código abierto y una colección de algoritmos de procesamiento de voz / sonido / voz / texto y lenguaje natural (NLP) escritos en Java y organizados en un marco modular y extensible que facilita la adición de nuevos algoritmos. MARF puede ejecutarse de forma distribuida a través de la red y puede actuar como una biblioteca en las aplicaciones o utilizarse como fuente de aprendizaje y extensión.

aubio :

aubio es una herramienta diseñada para la extracción de anotaciones de señales de audio. Sus características incluyen segmentar un archivo de sonido antes de cada uno de sus ataques, realizar la detección de tono, tocar el ritmo y producir transmisiones midi a partir de audio en vivo.

smokris
fuente

8

Estos pueden estar en un nivel diferente pero vale la pena echarle un vistazo> http://the.echonest.com/ y http://vamp-plugins.org/

Dan Barry
fuente

8

Si te gusta la recuperación de información musical, definitivamente deberías visitar:

MARSYAS

cufmo
fuente

8

Es posible que desee consultar las diferentes bibliotecas de códigos disponibles en Princeton Sound Lab , como STK (MARSYAS mencionado por cufmo es solo uno de sus proyectos). Es posible que pueda lograr los objetivos de su proyecto combinando las características relevantes de las diferentes bibliotecas allí.

Marcus Barnes
fuente

Biblioteca análoga a OpenCV para procesamiento / análisis de audio

Respuestas: