Quiero editar los metadatos de un PDF escaneado para asignar números de página personalizados a diferentes páginas. Por ejemplo, lo que ahora son las páginas 1-3 me gustaría llamar a i, ii y iii, y lo que son las páginas 4-10, quiero llamar al 1-7. Yo no quiero cambiar el orden real de las páginas.
¿Hay A) una forma de hacer esto usando herramientas gratuitas; y B) Una forma de hacer esto "en lote" (sin tener que renumerar cada página manualmente).
software-recommendation
pdf
MarkovCh1
fuente
fuente

Respuestas:
Aquí una solución basada en LaTeX. Utiliza el
pdfpagespaquete para incluir el PDF escaneado (aquí llamadoscan.pdf). Las etiquetas de página PDF que desea pueden configurarse utilizando elhyperrefpaquete con lapdfpagelabelsopción habilitada. Utiliza la\thepagemacro normal como una etiqueta que se puede definir con números romanos en minúsculas. El contador de páginas se reinicia y vuelve a cambiar a números normales.Coloque el código anterior en un archivo (por ejemplo
scan_mod.tex) y compílelo conpdflatex:Esto producirá
scan_mod.pdf. Sin embargo, cualquier anotación especial incl. Los hipervínculos desaparecerán. Esto no debería ser ningún problema con los PDF escaneados.Si necesita esto con más frecuencia, podría escribir un script que acepte el número de páginas con números romanos y los nombres de archivo como argumentos y cree un archivo temporal con el código anterior donde el nombre y los números son variables, que luego se compila.
fuente
Puedes hacerlo con un editor de texto.
Como dice la respuesta, abra un archivo PDF con un editor de texto, busque una
/Catalogentrada y luego agregue una entrada llamada/PageLabelsasí:Tenga en cuenta que los índices de página (números de página físicos) comienzan con
0.De cource, puede hacer esto automáticamente usando lenguajes de script.
Normas PDF - Etiquetas de página tiene especificaciones detalladas.
fuente
jPDF Tweak es una utilidad gráfica de código abierto que ofrece numeración de páginas (el término correcto es "etiquetado de páginas") y muchas otras funciones de edición de PDF de principiante a avanzado. Se ejecuta en Ubuntu y otros sistemas operativos.
La página de documentación proporciona instrucciones paso a paso.
fuente
Hay una herramienta llamada PDF Mod que es una herramienta gratuita para reorganizar las páginas de un PDF.
Se puede instalar desde el Centro de software de Ubuntu en Ubuntu 10.10 y superior.
Para instalar en Ubuntu 9.10 o 10.04:
Para instalar Agregue el ppa
ppa:pdfmod-team/ppaa sus fuentes de software ( Aquí se explica cómo hacerlo ) e instale pdfmod desde el centro de softwareAdaptado de: http://www.webupd8.org/2011/03/edit-pdf-documents-in-linux-with-pdf.html
Buena suerte: D
fuente
Acabo de encontrar un puntero que podría ser posible usar
ghostscriptpara esto, aquí: pdftk - Agregar y editar marcadores a pdf - Unix y Linux - Stack Exchange # 18600 ; se refiere a enlaces:Sin embargo, lo anterior trata con marcadores, no con paginación lógica. Resulta de pdfmarkReference.pdf , el "comando" necesario es '
/Label' (o '/PAGELABEL'), y se refiere además al capítulo 8.3.1 de PDFReference.pdf "Etiquetas de página". Desafortunadamente, ese capítulo no explica necesariamente cómo se pueden usar las marcas pdf con las etiquetas de página, pero esta publicación sí:... y más en ese hilo:
EDITAR: solo para mostrar esto, si tiene esto guardado como
pdfmarksarchivo:... y llamas:
... entonces obtendrá tres páginas vacías al final de
infile.pdf, etiquetadas con -1, 0 y 1 :)Bueno, tal vez esto ayude en algún momento a obtener un
gsscript más simple para renumerar las páginas :)¡Salud!
EDIT2: Creo que lo tengo, use el mismo
gscomando que el anterior, y debajo están los contenidos delpdfmarksscript, que renumerará el archivo infile.pdf, por lo que comienza con -1, 0, 1 ... Es básicamente un ejemplo modificado de la referencia en PDF (ver comentarios para más):fuente
Hay un pequeño script de Python que puede hacer el trabajo: https://github.com/lovasoa/pagelabels-py
En tu caso llama:
fuente
Openoffice / Libreoffice puede hacer el truco con la extensión de importación de pdf y una Macro de paginación.
No es una solución perfecta, pero funciona para mí (aparte de usar PDF Mod, lo que sugeriría encarecidamente).
fuente
Pruebe pyPdf , una biblioteca de python para manipular documentos PDF. Alguna, pero no mucha, programación sería necesaria.
También podría echar un vistazo a PDFtk , aunque no he comprobado si admite cambiar el número de página asociado con páginas individuales. Ambos están disponibles como paquetes en Ubuntu.
fuente
Existe otra aplicación llamada PDFEdit, alojada en la falsificación de código fuente. Página del proyecto de Source Forge : sin embargo, esto no ayuda porque no tiene la funcionalidad que necesita
fuente
pdfeditpuede mostrarCatalog/PageLabelsDict si un documento lo tiene, pero si está seleccionado, dice: " Este diccionario no tiene ninguna propiedad directamente editable " ... ¡Salud!