Dif. De archivo inteligente PDF

9

Tengo un documento de LibreOffice que convertí a PDF en algún momento utilizando las capacidades integradas. La marca de tiempo en el PDF es posterior a la del documento de procesamiento de texto, por lo que tiene sentido, pero no estoy absolutamente seguro de que el documento de procesamiento de texto produzca exactamente ese PDF. El documento tiene 20 páginas, por lo que no es una buena idea verificarlo manualmente.

Una posibilidad es rehacer el PDF en una carpeta diferente y luego hacer una diferencia binaria de los dos PDF. Lamentablemente, la línea de comando diffindica que los "archivos binarios son diferentes".

¿Existe una "diferencia binaria inteligente" que me ayudará a determinar si la diferencia está simplemente en metadatos o alguna diferencia no consecuente?

H2ONaCl
fuente

Respuestas:

13

En general, es una buena idea verificar si comando + extensión de archivo es lo que está buscando. Los resultados de diff + pdf en diffpdf .

sudo apt-get install diffpdf

DiffPDF se usa para comparar dos archivos PDF. Por defecto, la comparación es del texto en cada par de páginas, pero también se admite la comparación de la apariencia de las páginas (por ejemplo, si se cambia un diagrama o se reformatea un párrafo). También es posible comparar páginas particulares o rangos de páginas. Por ejemplo, si hay dos versiones de un archivo PDF, una con las páginas 1-12 y la otra con las páginas 1-13 debido a que se ha agregado una página adicional como página 4, se pueden comparar especificando dos rangos de páginas, 1 -12 para el primero y 1-3, 5-13 para el segundo. Esto hará que DiffPDF compare páginas en los pares (1, 1), (2, 2), (3, 3), (4, 5), (5, 6), y así sucesivamente, hasta (12, 13).

ingrese la descripción de la imagen aquí

Fuente: Ubuntugeek.com .

Rinzwind
fuente