¿Alguien sabe de una aplicación que pueda convertir audio a texto? Estoy ejecutando ubuntu 12.04 LTS.
27
¿Alguien sabe de una aplicación que pueda convertir audio a texto? Estoy ejecutando ubuntu 12.04 LTS.
Respuestas:
El software que puede usar es CMUSphinx . A diferencia de lo sugerido en otra respuesta, Julius no es adecuado porque requiere modelos. Los modelos de reconocimiento de voz de vocabulario extenso no están disponibles para Julius.
Puede usar pocketsphinx para convertir archivos de audio. Esos dos comandos deben hacer el trabajo. Primero convierte el archivo al formato requerido y luego lo reconoce:
La corrida de la esfinge
El resultado se almacenará en result.txt.
fuente
speech recognition
yvoice command
herramientas aquí: youtube.com/…pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.log
trabajado. Tal vez no sean paquetes óptimos, pero fueron las mejores coincidencias que pude encontrar en los repositorios.Sé que esto es antiguo, pero para ampliar la respuesta de Nikolay y, con suerte, salvar a alguien en el futuro, para que una versión actualizada de pocketsphinx funcione, debe compilarla desde el repositorio de github o sourceforge (no estoy seguro) que se mantiene más actualizado). Tenga en cuenta que -j8 significa ejecutar 8 trabajos separados en paralelo si es posible; Si tiene más núcleos de CPU, puede aumentar el número.
Luego, desde: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/ descargue las versiones más recientes de
cmusphinx-en-us-....tar.gz
yen-70k-....lm.gz
Luego, finalmente puede continuar con los pasos de la respuesta de Nikolay:
Sphinx funciona bien. No confiaría en él para hacer una versión legible del texto, pero es lo suficientemente bueno como para que pueda buscarlo si está buscando una cita en particular. Eso funciona especialmente bien si utiliza un algoritmo de búsqueda como Xapian ( http://www.lesbonscomptes.com/recoll/ ) que acepta comodines y no requiere expresiones de búsqueda exactas.
Espero que esto ayude.
fuente
pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory
------->export LD_LIBRARY_PATH=/usr/local/lib
------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
Si está buscando convertir voz a texto, puede intentar abrir su Centro de software de Ubuntu y buscar Julius
Descripción
O otra opción que no está en el Centro de software es Simon
Enlaces de referencia
http://julius.sourceforge.jp/en_index.php
http://sourceforge.net/projects/speech2text/
http://simon-listens.org/index.php?id=122&L=1
fuente
Puede usar el panel de transcripción speechpad.pw
Ver video sobre el uso de la transcripción
fuente