Supongamos que tengo un PDF y quiero obtener los metadatos disponibles para ese PDF. ¿Qué utilidad debo usar?
Encuentro que la información que más me interesa saber es el tamaño del papel, algo que los lectores de PDF generalmente no informan. Por ejemplo, ¿es el tamaño carta PDF, legal, A4 o algo más? Pero la otra información disponible también puede ser de interés.
EDITAR: Aquí hay una guía práctica para los tamaños de papel, gracias a @terdon.
pdf
file-metadata
Faheem Mitha
fuente
fuente
Respuestas:
Una de las herramientas canónicas para esto es
pdfinfo
, que viene con xpdf, si mal no recuerdo. Salida de ejemplo:fuente
pdfinfo
poder recogerla.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Otra utilidad que vale la pena considerar es exiftool . Puede que no sea la herramienta adecuada en su caso específico, ya que no informa ninguna información sobre la geometría del documento, pero en general es probablemente la herramienta más completa para inspeccionar metadatos PDF.
Aquí hay un ejemplo de un comando que imprimirá toda la meta información disponible (
-a
), ordenada por grupos (-G1
):La documentación oficial ofrece una descripción general de las etiquetas relacionadas con PDF compatibles:
Puede instalar exiftool en Debian / Ubuntu con:
Si está más interesado en el lado de la GUI, puede probar mi proyecto PDFMtEd . Es un conjunto de herramientas que sirven como interfaces gráficas para exiftool y permiten ver y editar metadatos PDF.
Aquí hay un par de capturas de pantalla:
fuente