¿Cómo eliminar la marca de agua de pdf usando pdftk?

33

Necesito eliminar alguna estúpida marca de agua de correo electrónico que se expande en todas las páginas de un libro de dominio público. Miré la página de manual de pdftk y algunos ejemplos, pero aún no puedo entender cómo eliminar las marcas de agua. Agradezco tus sugerencias.

hnns
fuente

Respuestas:

35

tarea muy simple de realizar:

usar sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

pero, después, asegúrese de reparar el resultado resultante pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

todo en un comando:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

las marcas de agua de texto no son más que un texto entre dos etiquetas dentro del código comprimido pdf

Dingo
fuente
1
¡Fantástico! trabajado como un encanto. simplemente cambie el nombre de la dirección de correo electrónico a una ficticia. No quiero que el tipo de malcriado sea el blanco de los spammers. Especialmente porque probablemente él haya hecho el pdf. Muchas gracias.
hnns
¡hecho! Se modificó una cadena específica con una cadena genérica
¿Alguien sabe cómo modificar esta solución para deshacerse de una marca de agua de enlace? Me deshice del texto, pero todavía queda un pequeño cuadrado donde solía estar el texto.
425nesp
pdftk se estrelló cuando ejecuté esto.
Cerin
@Dingo, ¿cómo lo procesan por lotes? Me refiero a varios archivos
Clain Dsilva
49

Solo un pequeño complemento a la respuesta de Dingo, ya que no funcionó para mí:

Primero tuve que descomprimir el documento PDF para poder encontrar la marca de agua y reemplazarla sed. El primer paso consiste en descomprimir el documento PDF usando pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

ahora, uncompressed.pdfse puede usar como en la respuesta de Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Luego reparé y recomprimí el documento:

pdftk unwatermarked.pdf output fixed.pdf compress
Philippe
fuente
¡Eres un salvavidas! ¡¡¡Gracias!!! :)
johndodo
1
¡Esto es realmente asombroso!
qed
44
Tomé este proceso, lo hice un poco más elegante y lo envolví en un script de Python. Está en github aquí .
Alexander Garden
@Alexander Garden No funciona, TypeError: str() takes at most 1 argument (2 given)cuando se usa siguiendo los consejos de uso dados
8bitjunkie
2
No funcionó para eliminar la marca de agua agregada por Master PDF Editor.
fccoelho
-2

Para eliminar www.it-ebooks.info,

abra el PDF en notepad ++ o textpad

reemplace www.it-ebooks.info con nada (en blanco)

guarda el archivo

Abierto en Adobe Reader estándar

Salga, se le pedirá que guarde el archivo

guárdalo

usuario549273
fuente
1
¿Es esta una solución general? ¿Qué es www.it-ebooks.info?
Karlo