Estoy buscando un buen programa para mostrarme las diferencias entre dos archivos pdf similares. En particular, estoy buscando algo que no solo ejecute diff en una versión ASCII (con "pdftotext") de los archivos. Esto es lo que hace pdfdiff.py .
39
Respuestas:
Puede usar DiffPDF para esto. De la descripción:
fuente
sudo apt-get install diffpdf
embargo, la versión anterior 2. * todavía se puede instalar a través de .Acabo de descubrir un truco para hacer que DiffPDF (el programa sugerido por @qbi) sea utilizable para más que cambios menores. Lo que hago es concatenar todas las páginas PDF en un rollo largo usando pdfjam y luego comparar los rollos. ¡Funciona incluso cuando se quitan o insertan secciones grandes!
Aquí hay un script bash que hace el trabajo:
fuente
Aunque esto no resuelve el problema directamente, aquí hay una buena manera de hacerlo todo desde la línea de comandos con pocas dependencias:
https://linux.die.net/man/1/pdftotext
Funciona muy bien para las comparaciones básicas de pdf. Si tiene una versión más nueva de pdftotext, puede probar en
-bbox
lugar de-layout
.En cuanto a los diferentes programas, me gusta usar diffuse, por lo que el comando cambia muy ligeramente:
http://diffuse.sourceforge.net/
Espero que ayude.
fuente
Si tiene 2-3 archivos PDF enormes (o epub u otros formatos, lea a continuación) para comparar, entonces es posible combinar el poder de:
calibre (para convertir su fuente a texto)
meld (para buscar visualmente las diferencias entre los archivos de texto)
paralelo (para usar todos los núcleos de su sistema para acelerar)
El siguiente script acepta como entrada cualquiera de los siguientes formatos de archivo: MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF y LRS.
Si no está instalado, instale meld, calibre y paralelo:
Para poder ejecutar el código desde cualquier lugar de su computadora, guarde el siguiente código en un archivo llamado "diffepub" (sin extensiones) dentro del directorio "/ usr / local / bin".
Asegúrese de que el propietario sea su usuario y que tenga permisos de ejecución:
Para probarlo, solo escribe:
Lo pruebo para comparar 2 revisiones de un pdf de +1600 páginas y funciona perfecto. Debido a que calibre está escrito usando python para la portabilidad, tomó 10 minutos convertir ambos archivos a texto. Lento, pero confiable.
fuente