¿Cómo puedo convertir archivos .epub a texto plano?

32

Puedo ver un archivo epub en, digamos, okular, seleccionar todo el texto y copiar y pegar en un editor de texto. Me gustaría un método de línea de comando: ¿alguien sabe algo así?

drevicko
fuente
Te recomiendo que uses alguna extensión de lectura de epub de firefox en lugar de un okular.
Adobe

Respuestas:

41

No sé si vale la pena instalar Calibre para su trabajo, pero si lo tiene, podría usar el potente convertidor de libros electrónicos:

ebook-convert input.epub output.txt

El formato de salida se deduce de la extensión del archivo de salida

Me imagino que podría haber algunas herramientas / scripts XML (XSLT) que pueden transformar epub en texto ya que epub es básicamente XHTML en el archivo ZIP

zetah
fuente
1
Calibre (y es "ebook-convert") es una herramienta muy poderosa. ¡Gracias!
drevicko
Si ha instalado calibre en OS X, la herramienta de línea de comandos se puede encontrar aquí: /Applications/calibre.app/Contents/MacOS/ebook-convert.
funroll el
Si usa la herramienta de línea de comando, es posible que deba configurar o configurar opciones para obtener la salida adecuada o podría terminar con una codificación incorrecta al convertir de epub a texto sin formato, por ejemplo. Al usar la interfaz de la aplicación, la configuración predeterminada parece funcionar bien.
lacostenycoder
6

Una alternativa es epub2txt de Kevin Boone , disponible en Github .

epub2html es una sencilla utilidad de línea de comandos para extraer texto de documentos EPUB y, opcionalmente, volver a fluir para que se ajuste a una visualización de texto de un número particular de columnas. Está escrito completamente en el estándar ANSI C.

Ejemplo de uso:

epub2txt input.epub > output.txt
xebeche
fuente
2

MuPDF puede convertir de epuba htmly txt. Para instalarlo:

sudo apt install mupdf mupdf-tools

Para usarlo:

mutool convert -o somefilename.txt somefilename.epub 

Asume la txtsalida de la -oopción.

Ver mutool convert documentación para más información.

pierrely
fuente