¿Alguien tiene alguna recomendación o procedimiento para reparar un PDF dañado? Cuando abro el archivo aparece "Hubo un error al abrir este documento. El archivo está dañado y no se puede reparar". Parece que hay una miríada de herramientas, pero ninguna que pueda describir como acreditada. ¿Hay alguna solución basada en Linux de código abierto para esto posiblemente?
pdf
repair
ghostscript
Tim Alexander
fuente
fuente
Respuestas:
Ghostscript reparará su PDF dañado automáticamente ... si puede abrirlo en primer lugar (es decir, si no está dañado sin posibilidad de reparación). Pero después, aún tendrá que volver a verificar el resultado ...
En Linux, intente este comando:
En Windows, prueba este:
fuente
Tenía un archivo PDF dañado
print.pdf
, que Ghostscript no podía abrir, pero los visores gráficos habituales de Linux PDF (Okular, Evince) se abrieron bien. (En mi caso, el archivo tenía basura al inicio en lugar de un encabezado PDF, cuando se abrió en un editor hexadecimal).Estos visores de PDF usan Poppler como un procesador de PDF de fondo. Para que pueda reparar el PDF utilizando las herramientas de línea de comandos de Poppler. En Ubuntu estos están en el
poppler-utils
paquete. Solía:que generó un archivo PDF con encabezados correctos, que herramientas como Ghostscript ahora aceptaban.
fuente
mutool
( página del proyecto , página de manual ) reparará archivos PDF rotos sin imprimirlos .sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf
Alternativamente, hay algunas herramientas y marcos que pueden descomponer / descompilar archivos PDF en sus componentes sin representarlos. Estos podrían ser útiles para extraer texto, guiones e imágenes. Consulte esta respuesta para obtener una lista de tales herramientas: https://reverseengineering.stackexchange.com/q/1526/8210 . Por ejemplo, puedes probar la respuesta principal actual Origami , tiene un visor basado en GTK.
fuente
mutool clean
no corrige todos los posibles errores. Tengo un archivo que tiene varios errores en la fuente y las secuencias de contenido, y mutool mantendrá esos errores.Tenía un archivo pdf dañado, porque el archivo php utilizado para descargarlo tenía algunos errores (en HTML) y caracteres NUL al final.
La solución fue abrir el pdf con Notepad ++ y eliminar todo el texto después de la línea.
fuente
%%EOF
. Eliminé todo después del primero%%EOF
usando un editor hexadecimal. Ahora todo funciona bien.