¿Cómo salida de texto a voz usando la línea de comandos?

Respuestas:

125

En orden de popularidad descendente :

  • say convierte el texto en voz audible utilizando el motor de voz GNUstep.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • festival Sistema general de síntesis de voz multilingüe.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say envía una solicitud de salida de texto a voz al despachador de voz

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak es un sintetizador de voz de software multilingüe.

    sudo apt-get install espeak
    espeak "hello"
    
Sylvain Pineau
fuente
13
spd-sayparece estar preinstalado en 14.04 y posteriores: releases.ubuntu.com/trusty/…
Ciro Santilli 新疆 改造 中心 法轮功 六四 事件
3
Además sudo pip install gTTS, (Google Text to Speech / github.com/pndurette/gTTS ) gtts-cli "hello" -o hello.mp3también puede canalizarlo mpg123 -. gtts-cli "why, hello there" | mpg123 -.
Elijah Lynn el
desafortunadamente, spd-sayno parece poder jugar tts simultáneamente, solo uno a la vez
phil294
@ElijahLynn no funciona
Dims
espeak/ spd-sayes el mejor para memes (los otros ni siquiera pueden pronunciar la palabra "meme" correctamente). Lo mejor que puedo decir es spd-sayusos espeakcomo su backend (las voces suenan igual).
QwertyChouskie
18

espeak Es una pequeña herramienta agradable.

Simplemente me gusta jugar con él en una línea de comando. Es posible que encuentre conflictos con Pulseaudio, por lo que estoy usando una versión de largo aliento que niega tener que configurarla correctamente.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help le mostrará las opciones para calibrar la velocidad de lectura, tono, voz, etc.

Cuando esté haciendo sus notas, guárdelas como un archivo de texto y luego:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Luego puede jugar con ffmeg et al para comprimir esto desde PCM a algo más manejable como MP3 u OGG. Pero esa es una historia diferente.

Oli
fuente
1
muy bueno, también se puede probar la interfaz gráfica de usuario para espeak, espeak-gui.
Sabacon
14

De man spd-say:

NOMBRE
       spd-say - envía una solicitud de salida de texto a voz al despachador de voz

SINOPSIS
       spd-say [opciones] "algún texto"

DESCRIPCIÓN
       spd-say envía una solicitud de salida de texto a voz al proceso de despachador de voz que lo maneja y, de manera ideal, genera el resultado
       al sistema de audio.

OPCIONES
       -r, --rate
              Establece la velocidad de la voz (entre -100 y +100, por defecto: 0)

       -p, --pitch
              Establece el tono del discurso (entre -100 y +100, predeterminado: 0)

       -i, --volumen
              Establece el volumen (intensidad) del discurso (entre -100 y +100, predeterminado: 0)

Por lo tanto, puede obtener texto a voz siguiendo el comando:

spd-say "<type text>"

Ex:

spd-say "Welcome to Ubuntu Linux"

También puede configurar la velocidad de la voz, el tono, el volumen, etc. Vea la página de manual.

Pandya
fuente
3
spd-say -t female2 "text"lo hace soportable
scorpiodawg
6

Mbrola no funciona desde las 11.10.

Las herramientas SVOX (pico) son fáciles de instalar, fáciles de usar y brindan voces de buena calidad en Ubuntu. Instalarlo:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Aún más fácil, puede usar LibreOffice en combinación con las herramientas SVOX (pico) instalando la extensión "Leer texto" y obtendrá una "GUI" para este excelente software TTS:

Configure las opciones de Leer extensión de texto con Herramientas - Complementos - Selección de lectura ... Use / usr / bin / python como programa externo. Seleccione una opción de línea de comando que incluya el token (PICO_READ_TEXT_PY).

leoperbo
fuente
4

Python Google Speach:

pip install google_speech

google_speech "Test the hello world"

Svox de Android:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Svox Nanotts:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Enlaces - Wiki:

Comparación de sintetizadores de voz

intika
fuente
1
Para instalar y utilizar google_speechen Ubuntu 18.04 que tenía que instalar python3-pipy libsox-fmt-mp3y utilizar pip3 install google_speech.
artm 01 de
3

Y otra GUI eSpeak: gespeaker. Utiliza ambos espeaky mbrolamotores. Además, tiene más opciones que espeak-gui.

luri
fuente
3

La siguiente no es una solución FLOSS, pero puede resultarle útil. (es una solución de vino ),

Personalmente estoy muy interesado en TTS, lo uso con bastante frecuencia ... por ejemplo. escuchando un discurso laberíntico que nunca me molestaría en seguir con otra cosa (porque necesito tomar otra taza de café ... :)

Algunas cosas que he descubierto en el camino ... o debería decir, cosas que no he descubierto en el camino ... Para decirlo sin rodeos: cada pieza del software de voz FOSS TTS que he probado está por debajo del nivel y, por lo tanto, inadecuado para cualquier escucha semi-prolongada ...

Actualmente uso las voces naturales de ATnT. Solo está disponible para Windows (tal vez Mac), pero se ejecuta wineen Ubuntu .. (tiene un glict menor, donde a veces necesito hacer clic en el panel cuando me alejo del lector ... Es un menor problema en comparación con la ventaja obtenida por la calidad del habla de NatualVoices.

Algunas otras cosas que he encontrado que son prácticamente esenciales para una experiencia auditiva medio sensible son: ...

  1. Estos programas de TTS no son inteligentes (bueno, tal vez tan inteligentes como un joven babuino) ... por lo que necesitan toda la ayuda que puedan obtener. y hay una (y sólo uno lector de programa que he encontrado que ayuda mucho en este .. La aplicación se llama ReadPlease (2003 Pro)... Se allowd modificar especialmente palabras y grupos de palabras que se pronuncian como usted los quiere ... Es de ninguna manera es perfecto, pero para mí, marcó la diferencia entre que todo el proceso sea utilizable y no utilizable ...

  2. El discurso en Natural Voices es "bueno", pero es un poco aburrido. También hay otros buenos productos, pero todos son para Windows, desafortunadamente).
    A veces sorprende bastante bien ... pero OMG, ¡inicialmente es un dolor! ... así que # 2 es * paciencia ... y mucha actualización de su lista de "palabras especiales" ... Por paciencia, quiero decir que (yo) realmente me acostumbré a los patrones de discurso de mi babuino en particular:) ... y por Por cierto, actualmente tengo alrededor de 3000 palabras que ahora suenan lo suficientemente "humanas" y ya no me estremezco cuando las escucho.

    3 .. "Follow the Bouncing Ball" ... Nuevamente, debido a que la voz nunca es tan buena como la de un hablante real, a veces las cosas necesitan aclararse ... El programa Reader que utilizo tiene una característica para la que incluso soporté su interfaz de aspecto torpe ... Tiene una opción de palabra "seleccionar el que se está leyendo actualmente". Muchos lectores tienen esto, pero ReadPlease mantiene la línea actual activada centro de la pantalla ... Esto es invaluable para poder ver hacia adelante y hacia atrás para volver a leer rápidamente lo que se perdió (por lo tanto, centrar automáticamente la línea de curación es bueno) ...

Bueno, esa es mi experiencia. Voy a hacer un café ahora, y mientras lo hago, estaré escuchando esto, para ver cómo se "lee" ... TTS es sorprendentemente bueno para recogerlo. errores tipográficos (hago muchos errores tipográficos) ...

Si algo tan bueno como ATnT NaturalVoices aparece en el repositorio de Ubuntu, saltaré sobre él.

Aquí hay un enlace a algunas muestras de Voces Naturales : uso "Mike"

Peter.O
fuente
3

SVOX pico2wave

Eso es lo que uso. Y suena natural, es fácil de entender, reconoce Unidades (m, ° C, kg, ...)

Aquí está mi primer post en pico2wave

¿Sonido natural de texto a voz?

Todo lo que tienes que hacer es:

Vaya al Centro de software de Ubuntu y busque "pico". Encontrará 4 o 5 entradas con "Small Footprint Ling ...". Instalarlos

Un posible uso de pico2wave se describe en mi primera publicación (siga el enlace de arriba).

Adiós

usuario85321
fuente
he utilizado su camino se puede pls decirme cómo conseguir una dulce voz femenina naturl usando su camino
user49557
3

Para festival(la voz me parece más natural):

sudo apt-get install festival

echo "hello" | festival --tts

Configuración de paso y velocidad:

crear ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Ver también http://www.solomonson.com/content/ubuntu-linux-text-speech

Actualización: probado en otra computadora ubuntu. Tuve que instalar el paquete de motor de voz en inglés para que funcione correctamente con el festival:

sudo apt-get install festvox-kallpc16k

También playes un comando cli que viene con el soxpaquete:

sudo apt-get install sox

d9k
fuente
2

Aunque ya ha aceptado una respuesta, quería mencionarla festival, que también me gusta bastante. Esta publicación en los foros de Ubuntu tiene mucha información sobre cómo configurar voces muy agradables.

precioso
fuente
2

Meet espeak-ng: un sintetizador de voz de software multilingüe:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Utiliza una voz en inglés predeterminada, pero hay muchas otras voces para otros idiomas e incluso dialectos disponibles y se pueden enumerar con espeak-ng --voices(para todos) o, por ejemplo, espeak-ng --voices=en(para inglés). Se pueden configurar -vjunto con la abreviatura del idioma o el nombre del archivo, por ejemplo, para escocés o swahili:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Hay muchas otras opciones disponibles, por ejemplo, -spara la velocidad y -wpara escribir la salida en un archivo wave, consulte la página de manual vinculada a continuación.

Otras lecturas

espeak-ng("Ng" para "próxima generación") es una bifurcación desarrollada activamente del espeaksoftware sintetizador de voz original , consulte el capítulo Historia en Wikipedia . Ambos están disponibles en las fuentes oficiales a través del paquete espeako espeak-ngrespectivamente.

postre
fuente
0

La herramienta gTTS es excelente para generar archivos de audio a partir de texto. Utiliza la API de texto a voz del Traductor de Google y genera archivos mp3.
Dado que se usa pippara la instalación, le recomiendo que instale Miniconda y luego lo use condapara crear un entorno en el que pueda instalar gTTS. Puedes descargar Miniconda desde aquí:

https://docs.conda.io/en/latest/miniconda.html

El repositorio de GitHub para gTTS es:

https://github.com/pndurette/gTTS

Y puede encontrar la documentación de gTTS aquí:

https://gtts.readthedocs.io/en/latest/

evaristegd
fuente