Acabo de enterarme de que los archivos PDF se pueden comprimir para reducir el tamaño de su disco.
- Me preguntaba cómo saber si un archivo PDF ya se ha comprimido.
- ¿Qué aplicaciones / comandos se pueden usar para comprimir o descomprimir un archivo PDF?
Mi entorno es Linux Ubuntu 10.10.
Algunos intentos no dan resultados satisfactorios:
Aquí están los resultados de intentarlo
pdftk
:$ pdftk 3.pdf output 5.pdf uncompress $ pdftk 3.pdf output 3comp.pdf compress $ ls -l 3.pdf 3comp.pdf 5.pdf -rwxrwx--- 1 root plugdev 8652269 2011-07-30 12:27 3comp.pdf -rwxrwx--- 1 root plugdev 8652319 2011-07-29 22:15 3.pdf -rwxrwx--- 1 root plugdev 16829828 2011-07-30 12:27 5.pdf
Las propiedades de los archivos muestran que no todos están optimizados.
Resultados de la conversión a ps y luego de vuelta a pdf:
$ pdf2ps 3.pdf 3.ps $ ps2pdf 3.ps 3c.pdf $ ls -l 3.pdf 3.ps 3c.pdf -rwxrwx--- 1 root plugdev 8808946 2011-07-30 13:14 3c.pdf -rwxrwx--- 1 root plugdev 8652319 2011-07-29 22:15 3.pdf -rwxrwx--- 1 root plugdev 122375966 2011-07-30 13:14 3.ps
file
. Debe mostrar si el archivo está comprimido o no.$file 3.pdf
es3.pdf: PDF document, version 1.4
Respuestas:
en breve:
Para saber si ya está comprimido:
strings your.pdf | grep /Filter
Para ( des ) comprimir un PDF, use QPDF
explicación:
La palabra clave "Filtro" dentro de un archivo pdf es un indicador del método de compresión utilizado. Algunos de ellos son:
(copiado de aquí ).
Sin embargo, dada la compleja estructura de archivos PDF, la mayoría de las veces alguna parte (o "flujo") del PDF ya se comprimirá de alguna manera (y se mostrará cuando grepping / Filter) mientras que otra parte no lo estará, así que no hay respuesta SÍ / NO a la pregunta de si el PDF está comprimido.
Una forma de superar esto sería agregar la
-c
opción a grep, que devuelve el número de ocurrencias, para que pueda ver relativamente qué tan bien está comprimido. por ejemplo, si devuelve menos de 10, es bastante no comprimido.strings
"large
.pdf" | grep -c /Filter
Otra propiedad relacionada con el tamaño de los archivos PDF es si se han optimizado para un acceso rápido, con archivos PDF "optimizados" de mayor tamaño, para citar de Wikipedia :
Puede verificar si el PDF está optimizado usando
pdfinfo your.pdf
.fuente
qpdf
ypdftk
haga más o menos lo mismo con respecto a la compresión, pero tambiénqpdf
puede optimizar (además de muchas más cosas).pdftk es una herramienta para realizar algunas operaciones en archivos PDF, como compresión / descompresión:
fuente
pdfinfo file.pdf
le indica si un PDF está optimizado . Sin embargo, no estoy seguro de si eso significa comprimido o no.Encontré el método de compresión en el archivo pdf. Abra el PDF con editor de texto. Ejecute un CCITT de búsqueda o de búsqueda si no se encuentra, ingrese JPEG, luego Flate, luego JBIG2, luego LZW, luego RLE y luego ZIP.
¡Suena peor de lo que es! Muy fácil de encontrar el método de compresión del flujo de datos.
fuente
Solo verifique sus propiedades; dirá si el archivo está comprimido o no.
fuente