Buena solución de texto a voz para Windows [cerrado]

9

Estoy ejecutando Windows 7 y sé que tiene la capacidad de leerme texto en mis aplicaciones, pero estoy buscando una buena utilidad para guardar fragmentos de texto como un archivo wav o mp3. Es posible que ya esté integrado en el sistema operativo, pero ingeniosamente disfrazado. Sé que puedo escribir un programa para llamar a la API, que es mi próximo paso si aún no hay una buena solución.

Realmente me gusta la calidad del sistema AT&T , pero tiene algunas restricciones bastante estrictas para usar el MP3 producido. Me gustaría usarlos en mi podcast.

Basarse en la Web también está bien, siempre y cuando produzca fácilmente un archivo Wav, MP3 o algún otro archivo de audio estándar sin gravámenes (dominio público o Creative Commons). Naturalmente, prefiero el código libre o abierto sobre el comercial, pero eso no es un requisito.

Jim McKeeth
fuente

Respuestas:

4

He intentado espeak , festival y MaryTTS . Todos generan voces comprensibles en su mayor parte, pero no son muy naturales. Incluso con descargas de voz adicionales para estos sistemas (por ejemplo, Mbrola, CMU Arctic) las voces no son tan buenas.

Las voces de IVONA son las mejores que he escuchado hasta ahora. Le dan una demostración gratuita de 30 días que es suficiente si tiene una tarea única que hacer. Después de eso son como $ 45 por voz. Amazon acaba de comprar la compañía para que sepa que es sólida ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Funcionan con la interfaz SAPI de Microsoft, lo que significa que las voces están disponibles para cualquier programa que lo admita (por ejemplo, Adobe Reader). Los he estado usando con el programa Text To Wav , que es bueno para la conversión masiva de archivos de texto en archivos de onda.

Editar

En realidad, solo vuelva a leer su pregunta y creo que para uso no personal (por ejemplo, podcasts), el precio es probablemente mucho más alto para IVONA. En ese caso, diría que echa un vistazo a MaryTTS.

Usuario
fuente
Acabo de escuchar a MaryTTS y explota el espeak y el festival.
treinta
MaryTTS tiene grandes voces, y también es gratis.
Jim McKeeth el
Parece texto a voz para las voces de Ivona para uso en escritorio ahora es proporcionado por TextAloud
Usuario
6

eSpeak es gratuito y de código abierto y ofrece todo lo que necesita.

Se puede ejecutar como un programa de línea de comandos para pronunciar texto desde un archivo o desde stdin.
Una versión de biblioteca compartida también está disponible.

* Incluye diferentes voces, cuyas características pueden ser alteradas.
* Puede producir salida de voz como un archivo WAV.
* SSML (Speech Synthesis Markup Language) es compatible (no completo),
  y también HTML.
* Tamaño compacto. El programa y sus datos, incluidos muchos idiomas,
  totaliza alrededor de 1 Mbytes.
* Puede traducir texto a códigos de fonema, por lo que podría adaptarse como frente
  fin para otro motor de síntesis de voz.
* Potencial para otros idiomas. Varios se incluyen en diferentes etapas.
  de progreso La ayuda de hablantes nativos para estos u otros idiomas es
  Bienvenida
* Herramientas de desarrollo disponibles para producir y ajustar datos de fonemas.
* Escrito en C ++.
John T
fuente
Si bien eSpeak parece interesante, realmente podría beneficiarse de una guía de "inicio rápido". Gracias por el consejo. Seguiré trabajando con eso.
Jim McKeeth el
+1 para eSpeak. He estado buscando una aplicación para hacer esto durante mucho tiempo. ¡Gracias Señor!
Axxmasterr