Estoy buscando un programa independiente del orador (comercial o gratuito) que me permita transcribir archivos de MP3 que contengan grabaciones de voz (especialmente podcasts) a texto. Quería probar Dragon Naturally Speaking, pero parece que solo admite la transcripción de mis propias grabaciones de voz. Entonces cuales son las alternativas?
16
Respuestas:
Dragon Naturally Speaking importará archivos mp3 e intentará transcribirlos. Prefiere ajustar su reconocimiento de voz al altavoz individual, pero hace un trabajo justo sin sintonizar. Probablemente funcionaría mejor si sus altavoces de podcast suenan como Tom Brokaw.
fuente
Una posible solución sería subir su video a Youtube y probar los subtítulos automáticos que puede habilitar ... aún no es demasiado preciso, pero puede descargar el archivo de subtítulos y editarlo usted mismo, si eso ayuda ... como para problemas de copyright / piratería de la canción, ¿podría hacer que el video sea privado en su perfil, si eso es posible?
fuente
Advertiría contra el intento de Dragon Naturally Speaking: escribí algunos scripts en mi iPhone con jailbreak para copiar / convertir todos los archivos de correo de voz de mi teléfono a una carpeta en mi PC y el servicio de transcripción Dragon Naturally Speaking se ejecutó contra ellos.
El resultado de ejecutar la transcripción contra archivos con diferentes altavoces era absolutamente inutilizable. He probado algunas de las alternativas de código abierto, pero el reconocimiento de voz independiente del hablante todavía parece estar limitado a diccionarios muy pequeños.
fuente
Estoy usando http://www.voicebase.com con podcast y videos en inglés y funciona muy bien. Es gratis por 50 horas de audio.
Puede descargar la transcripción de audio en rtf, srt o pdf.
Puede descargar las transcripciones de la máquina unos 10-15 minutos después de la carga y, a veces, antes.
fuente
Código abierto: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Comercial: Dragon NaturallySpeaking (Windows)
También podría probar este método si estuviera probando con osx, que se puede hacer usando audacity y soundflower
También podría encontrar algunos enlaces relevantes para opensource, otro shareware que valió la pena probar fue voxcribecc
Si eres un programador de .net, puedes usar este método para hacer tu propio kit
fuente
Podzinger sería una gran solución, pero no estoy seguro de que la rampa (el nuevo nombre de la compañía que solía ser EveryZing, que produjo Podzinger) ofrezca el servicio de forma gratuita ...
http://en.wikipedia.org/wiki/Podzinger
fuente