Reconocimiento de voz - software de MP3 a texto [cerrado]

16

Estoy buscando un programa independiente del orador (comercial o gratuito) que me permita transcribir archivos de MP3 que contengan grabaciones de voz (especialmente podcasts) a texto. Quería probar Dragon Naturally Speaking, pero parece que solo admite la transcripción de mis propias grabaciones de voz. Entonces cuales son las alternativas?

pako
fuente
Comentario de Avi: No creo que eso sea posible - independiente del orador
Ivo Flipse
que sistema operativo
studiohack
Windows o Linux.
pako

Respuestas:

7

Dragon Naturally Speaking importará archivos mp3 e intentará transcribirlos. Prefiere ajustar su reconocimiento de voz al altavoz individual, pero hace un trabajo justo sin sintonizar. Probablemente funcionaría mejor si sus altavoces de podcast suenan como Tom Brokaw.

moioci
fuente
2
Intenté Dragon Naturally Speaking, pero hizo un trabajo terrible para los podcasts con altavoces desconocidos. Solo funcionó bastante bien con mi propia voz después de entrenar el programa.
pako
1
¿También puede importar otros archivos de audio y transcribirlos?
Larry Morries
4

Una posible solución sería subir su video a Youtube y probar los subtítulos automáticos que puede habilitar ... aún no es demasiado preciso, pero puede descargar el archivo de subtítulos y editarlo usted mismo, si eso ayuda ... como para problemas de copyright / piratería de la canción, ¿podría hacer que el video sea privado en su perfil, si eso es posible?

studiohack
fuente
1
@studioback: ¿Este método de Youtube solo se aplica al propio video, no a los subidos por otros?
StackExchange for All
1
@Tim: es para ambos, en realidad.
studiohack
1
@studiohack: Para esos videos subidos por otros, ¿cómo hacer eso? Quiero decir, ¿sin descargar y subir como mis propios videos?
StackExchange for All
1
En la mayoría de los videos, hay un icono CC en la parte inferior, haga clic en él y luego transcripción automática ...
studiohack
2

Advertiría contra el intento de Dragon Naturally Speaking: escribí algunos scripts en mi iPhone con jailbreak para copiar / convertir todos los archivos de correo de voz de mi teléfono a una carpeta en mi PC y el servicio de transcripción Dragon Naturally Speaking se ejecutó contra ellos.

El resultado de ejecutar la transcripción contra archivos con diferentes altavoces era absolutamente inutilizable. He probado algunas de las alternativas de código abierto, pero el reconocimiento de voz independiente del hablante todavía parece estar limitado a diccionarios muy pequeños.

nvuono
fuente
1

Estoy usando http://www.voicebase.com con podcast y videos en inglés y funciona muy bien. Es gratis por 50 horas de audio.

Puede descargar la transcripción de audio en rtf, srt o pdf.

Puede descargar las transcripciones de la máquina unos 10-15 minutos después de la carga y, a veces, antes.

Juan Antonio Tubío
fuente
0

Podzinger sería una gran solución, pero no estoy seguro de que la rampa (el nuevo nombre de la compañía que solía ser EveryZing, que produjo Podzinger) ofrezca el servicio de forma gratuita ...

http://en.wikipedia.org/wiki/Podzinger

Zach
fuente