Puedes usar pdftk
para esto. Más información: Cómo exportar e importar marcadores PDF .
Exporte marcadores PDF en la línea de comandos de esta manera:
pdftk C:\Users\Sid\Desktop\doc.pdf dump_data output C:\Users\Sid\Desktop\doc_data.txt
Importe marcadores PDF desde un archivo de datos como este:
pdftk C:\Users\Sid\Desktop\doc.pdf update_info C:\Users\Sid\Desktop\doc_data.txt output C:\Users\Sid\Desktop\updated.pdf
pdftk
el formato de marcador es un poco tedioso de escribir. En lugar de ello he creado mi propia secuencia de comandos con bash
, sed
, pdftk
y python3
. Compruébelo en este repositorio: https://github.com/SiddharthPant/booky
Así que ahora puedo crear un archivo de texto ( bkmrks.txt
) como este que toma solo 5 minutos para escribir incluso para un pdf de 1000 páginas.
{
Title1, 1
Title2, 2
{
Subtitle1, 3
Subtitle2, 4
{
SubSubtitle1, 5
...
}
}
}
y luego uso mi script
./booky.sh pdf_file.pdf bkmrks.txt
esto crea automáticamente un pdf ( pdf_file_new.pdf
) que tiene mis marcadores en él.
Esto funcionará en los sistemas * nix si en cambio estás en una máquina Windows. Luego, primero instale python3
y pdftk
simplemente use el booky.py
archivo en el repositorio para convertir bkmrks.txt
a pdftk
formato compatible
python3 booky.py < bkmrks.txt > output.txt
y luego use el comando de exportación para generar un archivo de datos volcados. Elimine los marcadores anteriores de ese archivo e inserte contenido en su output.txt
lugar utilizando una simple copia y pegue. Y luego importar esos datos de nuevo.
Pantalón Siddharth
fuente
La especificación para archivos PDF está disponible como un PDF descargable de Adobe, o al menos fue la última vez que lo revisé. Sin embargo, la mayoría de los archivos PDF tienen la mayoría de los datos comprimibles comprimidos. Probablemente hubo una versión de PDF de texto sin formato alguna vez, y de ser así, seguirá siendo válida ahora, pero en realidad obtener un archivo en esa forma puede ser un problema.
Aunque no lo he hecho, una posibilidad muy probable (si está dispuesto a pagar) es comprar Acrobat Pro y usar las capacidades de secuencias de comandos Javascript integradas en esa aplicación. Para empezar ...
http://acrobatusers.com/tutorials/2008/10/auto_bookmark_creation
Este tutorial muestra cómo crear marcadores automáticamente usando Javascript en Acrobat 7.0 Pro (la versión incluida en Creative Suite CS2). Aunque se está volviendo un poco viejo, la misma técnica debería funcionar bien para las versiones más nuevas.
Las aplicaciones de Adobe incluyen una biblioteca para leer / escribir archivos de texto usando Javascript (algo que Javascript no tiene como estándar), por lo que es posible escribir sus propios scripts de importación / exportación, aunque no es trivial para hacer que esos scripts sean robustos.
fuente
Para exportar marcadores, sigo un enfoque diferente que requiere el uso de Microsoft OneNote:
Abro el lector de PDF (uso la versión gratuita de Foxit) con la estructura de marcadores visible y luego, en OneNote, solicito tomar una instantánea y seleccionar la estructura de marcadores de Foxit.
De vuelta a OneNote, selecciono la opción "Copiar texto de la imagen" (en el menú que aparece después de hacer clic con el botón derecho en la imagen de la instantánea) y la pego en el lateral para corregir la sangría (generalmente con viñetas).
fuente
HandyOutline. 1 arrastre, 1 clic, listo. https://sourceforge.net/projects/handyoutlinerfo/ . Gratis. Sangría sub-marcadores. No requiere ningún lector / editor de PDF. También edite, exporte todos los detalles al texto (copie en Word, escriba una macro para ordenarlo en un documento de Word completamente funcional) o XML, repaginate, importe a PDF. Dev merece donaciones.
PDF-Xchange Editor (reemplazado PDFViewer) marcadores aleatorios duplicados / perdidos exportados a texto
JPDF requirió Java, exportó basura de formato, no pudo limpiarlo solo para obtener los nombres
PDFtk me dio dolor de cabeza con solo mirar las instrucciones
:-)
fuente
Encontré otra solución bastante "estúpida" para copiar todos los marcadores en un PDF como texto para usar en otro lugar. En Acrobat Pro (para Mac OS) no hay forma de seleccionar todos los marcadores y copiarlos / pegarlos en un procesador de textos. Sin embargo, puede exportar todo el PDF como un archivo HTML con la opción "una sola página HTML + agregar un marco de navegación basado en marcadores". Luego abra el HTML en un navegador, seleccione todo el texto en el marco de navegación y cópielo / péguelo en un procesador de textos ...
fuente
Para leer todos los marcadores de un PDF a un archivo de texto, puede usar este comando con
pdftk
:Luego usé regex en Notepad ++ para eliminar las partes adicionales. Lo siguiente lo reemplacé por una cadena vacía (en orden), y luego terminé con una lista de marcadores (no se olvide de reemplazar usando regex en su editor de texto):
Si desea eliminar los números, reemplace esta expresión:
fuente