¿Existe un programa de línea de comandos para Linux que me permita leer el texto de los archivos PDF? Estaré dispuesto a vivir con la falta de fotos.
fuente
¿Existe un programa de línea de comandos para Linux que me permita leer el texto de los archivos PDF? Estaré dispuesto a vivir con la falta de fotos.
Hay varias herramientas de pdf2text en Ubuntu. Por ejemplo, el paquete poppler-utils contiene /usr/bin/pdftotext
.
Cómo abrir un archivo PDF en Linux / FreeBSD (la parte inferior del artículo le brinda las opciones que está buscando)
zathura es la herramienta que estás buscando => http://pwmt.org/projects/zathura/
Para Ubuntu y Arch Linux, solo use las herramientas de administración de paquetes apt-get install zathura
o pacman -S zathura
para instalar.
Para ver PDF en CLI / Terminales, simplemente ejecute zathura /path/to
NOTA : zathura
depende de las bibliotecas de cliente x11, no puede ejecutarse sin ellas. Entonces, si ssh a un host remoto y se ejecuta zathura
en él, tendrá que hacer el reenvío X11 (lo que significa que necesita ejecutar un servidor X, Ubuntu Desktop lo hará).
Uno puede usar less PDFFILE.pdf
, que muestra el texto del pdf. Se requiere pdftotext
de xpdf
. Creo que funciona bastante bien para archivos PDF con mucho texto.
Además, si desea poder ver el archivo pdf real (en baja calidad), puede usar el fbi , el visor de imágenes de framebuffer de Linux.
sudo fbi PDFFILE.pdf
Pequeño problema es que necesita privilegios de root.