¿Alternativa a Dragon NaturallySpeaking?

Respuestas:

18

Hay un artículo completo en Wikipedia dedicado al problema.

Desafortunadamente, parece que actualmente no hay una solución que funcione lo suficientemente bien, sino una lista masiva de proyectos que están en marcha.

Es posible que desee revisar la lista de soluciones para ver si hay algo que se ajuste a sus necesidades.

Platypus :

Siempre existe la posibilidad de ejecutar Dragon Naturally Speaking usando WINE . El Proyecto Platypus está creando un software para redirigir la salida de Dragon a cualquier aplicación Linux / X, y están muy avanzados.

Definitivamente deberías echarle un vistazo a esto.

Stefano Palazzo
fuente
5

Para obtener una respuesta actualizada, aquí hay un artículo de marzo de 2018: Las mejores herramientas gratuitas de reconocimiento de voz de Linux: software de código abierto .

Este artículo destaca el mejor software de reconocimiento de voz de código abierto para Linux. Tenga en cuenta que parte del software se encuentra en un estado inicial de desarrollo y, por lo tanto, no está listo para su adopción generalizada.

Antes de examinar nuestras recomendaciones, Jasper merece una mención especial. Es una excelente plataforma de código abierto para desarrollar aplicaciones siempre controladas por voz. Tal vez se pregunte por qué HTK no aparece a continuación. Por supuesto, HTK es un juego de herramientas de reconocimiento de voz popular. Pero HTK no es elegible para aparecer en las soluciones recomendadas. No porque sus derechos de autor sean propiedad de Microsoft, sino simplemente porque es un software propietario.

Exploremos las 6 herramientas de reconocimiento de voz gratuitas disponibles. Para cada título, hemos compilado su propia página de portal con una descripción completa y un análisis en profundidad de sus características.

Herramientas de reconocimiento de voz de código abierto

  • Implementación DeepSpeech TensorFlow de la arquitectura DeepSpeech de Baidu.
  • Julius Motor de reconocimiento de voz continuo de vocabulario grande de dos pasadas
  • Software de reconocimiento de voz Simon Flexible
  • Sistema de reconocimiento de voz CMUSphinx para aplicaciones móviles y de servidor
  • deepspeech.pytorch Aplicación de DeepSpeech2 usando Baidu Warp-CTC.
  • Kaldi C ++ toolkit diseñado para investigadores de reconocimiento de voz.
WinEunuuchs2Unix
fuente
4

Puede instalar la versión de Chromium 11 desde el ppa ppa:chromium-daily/stable( Cómo agregar un PPA ) y agregar --enable-speech-input al final del iniciador.

ingrese la descripción de la imagen aquí

¡Ahora visite este sitio web y whoo! Speech-to-Text en ubuntu usando html5.

Leí aquí que si hablas lentamente, será más preciso.

ingrese la descripción de la imagen aquí

Lincity
fuente
3

freespeech-vr

Es un motor de voz de código abierto a texto decente. Aquí el código fuente ( en Google Code )

Tenga en cuenta que se necesita un poco de configuración, que está menos pulida que la configuración de Dragon Naturally Speaking.

dotancohen
fuente
2
FreeSpeech parece no mantenerse. No ha ofrecido un ppa desde Ubuntu 10.
JellicleCat
2
Ahora hay un puerto Python 3 de FreeSpeech.
dotancohen