¿Cambiar el nombre del archivo PDF de acuerdo con los metadatos?

Respuestas:

4

Si se siente cómodo con Python , puede usar el script en http://blog.matt-swain.com/post/25650072381/a-lightweight-xmp-parser-for-extracting-pdf-metadata-in . Acabo de probar los scripts que proporciona (para empezar, puedes pip install pdfminer) y funcionan muy bien. El resultado que dan es algo similar a:

[{'ModDate': "D:20050422142709+02'00'", 'CreationDate': "D:20050422142709+02'00'", 'Producer': 'Mac OS X 10.3.8 Quartz PDFContext', 'Creator': 'Word'}]

Esa salida que podría usar para cambiar el nombre de sus archivos.

don.joey
fuente
1
De hecho, hasta ahora he asumido que te refieres a metadatos con contenido (basado en tu enlace). También hay una buena herramienta para la recuperación de información académica disponible. Se llama pdfmeat .
don.joey
5

Esto es muy fácil de lograr con exiftool .

Por ejemplo, el siguiente comando cambiaría el nombre de todos los archivos en el directorio actual a <title>.extension:

exiftool '-filename<$title.%e' .

Puede instalar exiftool en Ubuntu con:

sudo apt-get install libimage-exiftool-perl

Consulte la documentación oficial para más información:

http://www.sno.phy.queensu.ca/~phil/exiftool/filename.html

Glutanimato
fuente
3

Hay otra alternativa Usted podría sudo apt-get install pdftk. Con esa biblioteca puede ejecutar un comando como el pdftk myfile.pdf dump_dataque da como resultado algo en un conjunto de infoy value:

InfoKey: Creator
InfoValue: Word
InfoKey: Producer
InfoValue: Mac OS X 10.3.8 Quartz PDFContext
InfoKey: ModDate
InfoValue: D:20050422142709+02'00'
InfoKey: CreationDate
InfoValue: D:20050422142709+02'00'
PdfID0: d7af25c8df737276d8d6b5de49d94d92
PdfID1: d7af25c8df737276d8d6b5de49d94d92
NumberOfPages: 58

De nuevo, podría usar esa información en un script de cambio de nombre. Si siente que esto último es algo mejor personalizado porque depende de si solo desea el título, el autor del título u otra cosa.

Fuente

don.joey
fuente
0

Si está buscando una solución lista para usar y sus archivos PDF son de naturaleza académica, puede probar Zotero , el complemento de Firefox.

Desafortunadamente, esto requiere varios pasos, cada uno de los cuales puede ser un poco lento si está tratando de trabajar con muchos archivos PDF a la vez:

  1. Arrastre y suelte sus archivos PDF en Zotero.
  2. Haga clic con el botón derecho en ellos para recuperar los metadatos (y descargar automáticamente la información bibliográfica).
  3. Si los archivos se reconocieron correctamente, vuelva a hacer clic con el botón derecho para cambiar el nombre automáticamente.
  4. Exporte o mueva directamente los archivos renombrados donde desee.

La respuesta a una pregunta similar sobre Superusuarios muestra cómo hacer lo mismo con Mendeley . En Zotero, este proceso puede automatizarse aún más con Zotfile . Finalmente, aquí hay una lista extensa de herramientas potencialmente útiles en este sentido.

Brian Z
fuente