Cómo convertir un PDF a un PDF / A

18

Mi universidad requiere archivos PDF para ser presentados en formato PDF / A .

Traté de encontrar un convertidor, pero todos son muy caros y / o complicados.

¿Cómo convierto mi archivo PDF existente en un PDF / A?

¡Muchas gracias!

ben
fuente
1
Si solo se trata de documentos de procesamiento de texto con formato simple, puede abrirlos en OpenOffice y guardarlos como PDF (OpenOffice tiene una exportación de PDF nativa pero no sé si es compatible con PDF / A). Aparte de eso, pregúntele a su escuela si pueden proporcionarle alguna herramienta, ya que es su requisito hacerlo.
FrustratedWithFormsDesigner
3
@FrustratedWithFormsDesigner: LibreOffice le permite exportar documentos de texto como PDF / A, como se explica aquí .
ThatGuy
@ThatGuy -100 leyó la pregunta: ¡estaba pidiendo convertir PDF!
Tomás
1
@Tomas: ¯ \ _ (ツ) _ / ¯ ... No estaba respondiendo la pregunta de OP. Estaba respondiendo claramente a FrustratedWithFormsDesigner.
ThatGuy

Respuestas:

5

Para guardar documentos de Word existentes en PDF / A, todo lo que necesita es una versión reciente de Microsoft Word. Para crear desde otros productos que imprimen, puede usar un creador de PDF / A gratuito como el que se encuentra en www.freepdfcreator.org

Si necesita validar que un archivo PDF / A es compatible, puede usar nuestro servicio gratuito en www.validatepdfa.com

Convertir archivos PDF existentes a PDF / A sin pérdidas es un poco más complicado y no siempre es posible. Acrobat 9 y 10 pueden hacer esto. Nuestro negocio, Solid Documents, también vende un producto que hace esto (y otras funciones comunes de archivo) por $ 99: Solid PDF Tools

Pragmático
fuente
3
Desafortunadamente, Free PDF Creator a menudo causaba que los programas desde los que intentaba imprimir se colgaran o fallaran, y mostraba brevemente algunas ventanas emergentes sobre "ofertas especiales". Cuando me puse en contacto con el soporte de Solid Documents, me informaron que "la versión gratuita es una versión intermedia, y no podemos considerar sus problemas".
Mark Berry
La respuesta de Kurt Pfeifle a continuación es mucho mejor.
mb21
16

PDF / A es un estándar internacional ISO para un PDF rchiving. El estándar solicita el cumplimiento estricto de su conjunto de reglas (como: "incrustar todas las fuentes", "no usar transparencias", "no usar JavaScript", "sin cifrado", ...).

Hay muchos archivos PDF que dicen ser PDF / A, pero no pasan una prueba de humo real. Ese reclamo es solo una etiqueta en los metadatos del archivo. Esa etiqueta puede hacer que Fe Acrobat Reader muestre una pista especial cuando se procesa.

Una verificación de cumplimiento real requiere un software comercial "previo al vuelo" bastante expansivo. Actualmente no conozco ninguna utilidad gratuita para hacer ese trabajo. Consulte también aquí los resultados de algunas pruebas: Isartor testsuite .

Puede usar Ghostscript para (intentar) convertir PDF a PDF / A. Aquí se documenta cómo hacerlo ( Actualización: para versiones más recientes aquí ).

Pero tenga en cuenta: este documento se actualizó muy recientemente [ * ]. Las versiones anteriores de Ps2pdf.htm de Ghostscript indujeron a error a los usuarios a ejecutar un comando que creó archivos PDF que afirmaban ser PDF / A pero que fallaron las pruebas de humo reales.

Cómo convertir PDF a PDF / A con Ghostscript:

Aquí hay una línea de comando:

gswin32c ^
   -dPDFA ^
   -dNOOUTERSAVE ^
   -dUseCIEColor ^
   -sProcessColorModel=DeviceCMYK ^
   -sDEVICE=pdfwrite ^
   -o output_pdfa.pdf ^
   -dPDFACompatibilityPolicy=1 ^
    PDFA_def.ps ^
    input.pdf

[ * ] Nota: El problema radica en el parámetro PDFA_def.ps. Este es un archivo que necesita editar para satisfacer sus necesidades. Ghostscript se envía con una muestra de este en su /libsubdirectorio. Esta muestra no funcionará tal cual sin que la edite. La forma de editar está dentro de los comentarios de la muestra.

Kurt Pfeifle
fuente
Entonces, ¿es seguro decir que PDF / A no es un formato de archivo per se, sino realmente un conjunto de requisitos de cumplimiento para crear un archivo PDF utilizando la tecnología existente?
JohnFx
3
@ JohnFx: en cierto modo, sí. Cada PDF / A-1b (o PDF / A-1a) también es un PDF válido en el sentido general. Pero no todos los PDF se validan con éxito como PDF / A *. Las especificaciones PDF / A- * hacen 2 cosas: (1) limitar el conjunto de características especificadas en la especificación general PDF-1.4 a un subconjunto de las permitidas; (2) requiere seguir estrictamente algunas reglas que en la especificación general de PDF son "hacer o no hacer, como quieras" (como incrustar todas las fuentes utilizadas).
Kurt Pfeifle
7

Utilicé el siguiente comando para convertir PDF a PDF-A:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf PDFOriginal.ps

Si tiene un archivo PDF, primero conviértalo a PS para que funcione con el código anterior. Intenté varias veces con el archivo PDF para convertirlo directamente a PDF-A. Sin embargo, no funcionó.

Aquí hay una manera de convertir su archivo PDF a PS:

pdftops PDFOriginal.pdf PDFOriginal.ps
Soham
fuente
Desafortunadamente, mi universidad no acepta estos archivos PDF: /
Tomas
4

La herramienta ' Guardar como PDF ' de Microsoft Office 2007 guarda en formato PDF / A.

Un documento PDF / A es solo un documento PDF que utiliza un subconjunto específico de PDF diseñado para garantizar que sea 'autocontenido'. Es decir, no está permitido depender de información de fuentes externas (por ejemplo, programas de fuentes e hipervínculos). De wikipedia :

Otros elementos clave para la compatibilidad con PDF / A incluyen:

* Audio and video content are forbidden.
* JavaScript and executable file launches are forbidden.
* All fonts must be embedded and also must be legally embeddable for
  unlimited, universal rendering. This also applies to the so-called     
  PostScript standard fonts such as Times or Helvetica.
* Colorspaces specified in a device-independent manner.
* Encryption is disallowed.
* Use of standards-based metadata is mandated.

Editar:

Puesto que no hay realmente ninguna herramienta para probar si un PDF es PDF / A, que es una apuesta segura que al igual que usted, su universidad también tiene manera de prueba de que el documento se le envía es PDF / A .

Es probable que la única razón por la que lo soliciten específicamente es para que puedan estar seguros de que todo el contenido estará "allí" cuando lo abran. Simplemente expresaron este requisito de manera bastante críptica (y mal) como que tenía que ser PDF / A. Entonces, una manera simple de probar si el PDF cumple con su verdadero requisito de autocontención es transferir el PDF y verlo desde otra computadora (preferiblemente fuera de línea) y asegurarse de que todo aparezca como debería.

imoatama
fuente
2
ah, ¿hay alguna manera de determinar si un PDF existente es PDF o PDF / A?
ben
1
@ben: no conozco ninguna herramienta que determine si un PDF es realmente PDF / A. PDF / A es un estándar internacional ISO para un PDF rchiving. El estándar solicita el cumplimiento estricto de su conjunto de reglas ("incrustar todas las fuentes", "no usar transparencias"). Hay muchos archivos PDF que afirman ser PDF / A, pero fallan las pruebas de humo reales. Ese reclamo es solo una etiqueta en los metadatos del archivo. Esa etiqueta puede hacer que Acrobat Reader muestre una pista especial. Una verificación de cumplimiento real requiere un software comercial bastante expansivo. No conozco ninguna utilidad gratuita para hacer ese trabajo.
Kurt Pfeifle
Gracias por la información Pipitas: parece probable que incluso la unidad no pueda verificar con certeza si el documento es PDF / A, por lo que no es un requisito difícil: vea mi edición.
imoatama
@imoatama: ¿viste mi otra respuesta? Explica cómo convertir PDF a PDF / A. Si lo usa -dPDFACompatibilityPolicy=0, su PDF reclamará ser PDF / A incluso si el proceso de conversión de Ghostscript notó cosas que no cumplen y que no pudo reparar. Es posible que haya creado este tipo de PDF 'falso' / Como ya he mencionado en otro lugar ...
Kurt Pfeifle
MS Word 'guardar como PDF' también afirma que el PDF es PDF / A. No es necesario usar Ghostscript.
imoatama
2

En macOSX sin usar pdftopslo que no pude instalar (como propuso @ soham.m17) puede hacer:

pdf2ps oldPdf.pdf psVersionOfOldps.ps

para convertir su pdf a formato ps y luego:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf psVersionOfOldps.ps

para convertir en pdf / A.

Francesco Pegoraro
fuente
1

La única forma que funcionó para mí en Windows 10 fue una ligera modificación de la respuesta de soham (que para mí estaba funcionando pero con errores):

  • convirtiendo el PDFa ps(con pdf2ps source.pdf temp.ps)
  • convertir de nuevo la pspara PDF/Ael uso de Ghostscript 9.22 con

gswin64c -dPDFA -dBATCH -dNOPAUSE -dPDFSETTINGS=/prepress -dNOOUTERSAVE -sColorConversionStrategy=UseDeviceIndependentColor -sProcessColorModel=DeviceRGB -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=destination.pdf temp.ps

(Es posible que deba agregar antes de gswin64cla ruta completa, que para mí fue C:\Program Files\gs\gs9.22\bin\, lo mismo para pdf2ps, en este caso, la ruta para mí fue C:\Program Files\gs\gs9.22\lib\)

Si el archivo resultante es demasiado grande, puede omitir la -dPDFSETTINGS=/prepressopción. Sin esta opción, el archivo resultante es más pequeño (incluso más pequeño que el original en mi caso), pero se puede observar una degradación en la calidad de la imagen.

El resultado PDFparece ser conforme PDF/Aincluso sin la -dNOOUTERSAVEopción, aunque hay menos fuentes incrustadas (tal vez alguien pueda explicar la diferencia).

Cuando digo "se ajusta a PDF/A" quiero decir no solo que el PDF/A"banner" aparece en Acrobat Reader, sino que el archivo pasa la validación en línea proporcionada por https://www.pdf-online.com/osa/validate.aspx

No sé cuánto es confiable ese servicio de validación en línea, sin embargo, logró detectar archivos no conformes que mostraban el PDF/A"banner" en Acrobat Reader (que, por lo tanto, no parece confiable a este respecto).

mmj
fuente
0

Respuesta simple:

Puedes instalar Libre Office , es gratis

Abra el PDF y guárdelo como PDF ... [marque la opción PDF / A]

... ya terminaste!

PYK
fuente