¿Cómo reduzco el tamaño de un PDF y conservo los marcadores?

19

Tengo un ~ 259 MB PDF. Lo hice pdf2psy ps2pdf. El tamaño final fue de 45 MB. No veo ninguna diferencia visible en la calidad en ningún lector. Aunque, los marcadores se perdieron. Intenté usarlo pdftk, pero no conservó los marcadores.

pdftk ... update_info

¿Qué causó la gran reducción de tamaño? ¿Existe una alternativa para preservar los marcadores y aún tener el tamaño reducido (preferiblemente alternativas de línea de comandos de Linux)?

Vishnu Kumar
fuente
Continuando con la respuesta de @ Dan: diferentes codificaciones (y compresión) podrían explicar la diferencia. Como una prueba simple, observe el tamaño de cualquiera de los archivos después de la compresión con gzip. ¿La diferencia de tamaño sigue siendo impresionante?
Henk Langeveld

Respuestas:

17

Puede probar ghostscript con salida de ebook y los marcadores parecen conservarse:

gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dPDFSETTINGS=/ebook -sOutputFile=newFile.pdf originalFile.pdf
perreal
fuente
2
gracias funcionó. Yo usé el PDFSETTINGS=/screen. Con esa opción, el pdf se convirtió en 15MB :) Ref: GS Tips
Vishnu Kumar
Olvidé mencionar que los marcadores fueron preservados. ¿Pero todavía alguien tiene pistas sobre qué se está reduciendo?
Vishnu Kumar
2

@Vishnu Kumar

Me alegra que lo hayas preguntado. Su pregunta me llevó a volver a examinar este problema y descubrí que había extraído 100 páginas de un PDF de más de 1000 páginas, usando Acrobat Pro, como un caso de prueba, sin embargo, eso no incluía los marcadores TOC como había supuesto y fue el problema Así que abrí el PDF grande original en Acrobat Pro y eliminé todas menos las primeras 100 páginas y eliminé todos menos los marcadores relevantes y lo guardé como mi caso de prueba. Ahora se conserva el TOC.

Aquí está mi comparación de las dos configuraciones:

/ebook selects medium-resolution output similar to the Acrobat Distiller "eBook" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-ebook].pdf input_1-102_TOC.pdf

ridículamente lento
91.7MB -> 33.4MB (36% del original)
TOC preservado de
mala calidad - pixelado

/printer selects output similar to the Acrobat Distiller "Print Optimized" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-printer].pdf input_1-102_TOC.pdf

rápido
91.7MB -> 68.9MB (75% del original)
TOC conserva la
calidad casi idéntica

Otros ajustes:

/default selects output intended to be useful across a wide variety of uses, possibly at the expense of a larger output file.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/default -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-default].pdf input_1-102_TOC.pdf

rápido
91.7MB -> 60.8MB (66% del original)
TOC conserva la
calidad casi idéntica

/prepress selects output similar to Acrobat Distiller "Prepress Optimized" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-prepress].pdf input_1-102_TOC.pdf

rápido
91.7MB -> 80.2MB (87% del original)
TOC conserva la
calidad casi idéntica

Como se puede ver, la /defaultconfiguración funcionó mejor, dando el tamaño más pequeño para la mejor calidad.

hmj6jmh
fuente
0

Ignore esto y vea la actualización como resultado del Vishnu Kumarcomentario de '.

Esto no funcionó para mí. Sí, redujo el tamaño a la mitad pero con fuentes pixeladas inaceptables y no más marcadores TOC, como con cualquier otra configuración de salida que probé gs, es decir, screeny printer. Gracias de cualquier manera…

hmj6jmh
fuente
¿Lo has intentado /ebook?
Vishnu Kumar