¿Cómo “cat” o “less” un archivo .odt de escritor de libreoffice?

Respuestas:

35

La solución está usando odt2txt. Ahora, este comando lo proporcionan dos paquetes diferentes, uno llamado odt2txtque puede instalar con

sudo apt-get install odt2txt 

y por el paquete unoconv(que ofrece también conversiones de línea de comandos entre más formatos de libreoffice), que es instalado por

sudo apt-get install unoconv

Si tiene los dos, puede cambiar entre ellos utilizando el mecanismo alternativo :

sudo update-alternatives --config odt2txt

Si está utilizando lo odt2txtproporcionado por el paquete odt2txtque acaba de utilizar

odt2txt file.odt

si usa el unoconvpaquete provisto, debe usar

odt2txt --stdout file.odt

Conéctelos lesspara tener una experiencia menos parecida ( odt2txt file.odt | less)

Tenga en cuenta que si no utiliza la --stdoutopción, el paquete proporcionado por unoconv escribirá el resultado en un archivo llamado file.txt.

El paquete sugerido por la distribución parece ser el del odt2txtpaquete (tiene una prioridad predeterminada más alta en el sistema alternativo); seguro tiene menos dependencias.

Rmano
fuente
¡Fantástico, gracias! Sí, he instalado el odt2txtpaquete y se comporta como debería.
Avio
El problema con unoconv, como he descubierto, es que quiere instalar una versión anterior de Libre Office si tiene una nueva instalada. Por lo tanto, quédate con sudo apt install odt2txt.
Paddy Landau
@ PaddyLandau Edité mucho la respuesta, gracias por la pista.
Rmano
@Rmano También me has enseñado update-alternatives, gracias.
Paddy Landau
7

Puede navegar por el texto sin ninguna utilidad especial. El archivo ODT es un archivo zip renombrado. Descomprímalo y verá varios archivos. Uno de ellos, content.xmlcontiene todo el texto y es moreo lesslegible.

Barafu Albino
fuente
2

No se puede cato lesso moreun archivo .odt porque es un archivo binario. En realidad, como se dijo anteriormente, es un archivo .zip renombrado, por lo que debe extraer el content.xmlarchivo, pero eso, como implica, es un documento XML, por lo que debe procesarlo como tal para extraer la información de él.

Paul Robinson
fuente