Estoy buscando buenas herramientas para el procesamiento de señales de audio. Por ejemplo, análisis de voz y música, identificación automática del idioma, etc.
¿La biblioteca Scipy proporciona funciones para el procesamiento de audio? ¿Tiene una buena herramienta para el procesamiento de señal de audio?
¿Puedes sugerir una herramienta para esto?
audio
python
signal-detection
usuario1147663
fuente
fuente
Respuestas:
Personalmente, considero que Python es una de las mejores opciones que existen e hice algo de trabajo en el área de identificación de audio. Le invitamos a comprobar, por ejemplo, mi software para la identificación automática de aves a partir de grabaciones de audio ruidosas: Ornithokrites . El programa es utilizado por el Departamento de Conservación de Nueva Zelanda y están contentos con él. En base a este ejemplo, me gustaría señalar varias ventajas de usar Python:
Mi segunda opción sería R. Aunque no es tan rico en funciones como Python, tiene una gran cantidad de bibliotecas útiles (consulte, por ejemplo, seewave para sus aplicaciones). La instalación de ambos en Windows y Linux es pan comido, lo cual es importante si desea que otros usen su programa. Sin embargo, según mi experiencia, la informática de alto rendimiento en R es más difícil, algo importante a tener en cuenta si necesita hacer MUCHO procesamiento e identificación.
Ejemplos de clasificación de música en Python:
Book Building Machine Learning Systems con Python tiene un capítulo sobre clasificación musical
Otras herramientas (la lista no está completa): Python in Music
fuente
Parece que Python es un lenguaje popular para esto con algunos buenos conjuntos de herramientas basados en el hecho de que bueno ... Lo he visto en uso en algunos departamentos y compañías de tecnología de la música.
En la academia, es muy común ver este tipo de trabajo realizado en Matlab, ya que reúne muchos kits de herramientas potentes (procesamiento de señales, computación paralela, gráficos, utilidades de bases de datos, aprendizaje automático, IA) en un IDE fácil de probar. Sin embargo, cuesta dinero y tiene algunos inconvenientes (no es el mejor lenguaje de programación en términos de diseño y rendimiento de la aplicación, por lo que es principalmente una herramienta de creación de prototipos, pero puede compilarse hasta C). Octave es la alternativa gratuita, pero no puedo garantizar la calidad de las herramientas de procesamiento de señales o el software en sí, ya que no lo he usado.
fuente
scipy
El ecosistema tiene mucha funcionalidad de MATLAB.También puede consultar pyAudioAnalysis : combina bibliotecas abiertas para el reconocimiento de patrones y varias implementaciones de funciones de audio. Algunos ejemplos de aplicaciones implementadas en pyAudioAnalysis , que pueden resultar interesantes:
fuente
Puede usar la biblioteca C ++ de análisis de audio de Essentia , que incluye enlaces de python. Aprovecharás todas las ventajas del entorno python / scipy además de muchos algoritmos de análisis de audio / música que vienen con Essentia.
fuente