¿Hay una mejor manera de redactar un PDF?

25

Tuve que imprimir un par de archivos PDF recientemente para enviárselos a alguien, pero quería redactar (oscurecer) un par de pequeños fragmentos de texto.

Una búsqueda rápida en Google no mostró ninguna herramienta para este propósito específico, así que recurrí a imagemagick & gimp:

  • convert document.pdf document.png
  • gimp document-0.png
  • (use pincel para oscurecer el texto)
  • imprimir página redactada desde gimp
  • imprimir páginas restantes de xpdf

El problema con esta estrategia es que el proceso de conversión (de PDF a PNG o cualquier otro formato) pierde calidad. Intenté editar el PDF en gimp pero no funcionó de inmediato.

¿Existe una herramienta específica que permita la redacción de esta manera? (Ni siquiera tiene que ser una redacción "real": no estoy enviando una copia impresa, por lo que la redacción "falsa" funcionará porque la copia impresa no puede ser pirateada para revelar el texto subyacente).

¿O hay algún truco para poder editar archivos PDF en gimp?

bstpierre
fuente
2
PDF es escalable, PNG es gráficos de trama, por lo que probablemente haya una pérdida de calidad en el proceso de conversión. Convierta a un formato escalable en su lugar, como SVG.
Anónimo
@ Anónimo: Buena idea, pero no utilizable. El archivo SVG resultante es masivo; Tuve que matar al espectador después de 30 minutos y un GiB más o menos de consumo de memoria.
bstpierre

Respuestas:

16

(originalmente recomendé Okular pero no funcionó como esperaba)

1. Edite el documento en un editor de vectores

Pude abrir un archivo PDF en Inkscape , dibujar un rectángulo sobre un texto e imprimirlo. Inkscape es un editor de vectores, por lo que no implica rasterización. Sin embargo, algunas fuentes se veían mal, probablemente porque el documento fue creado en una máquina Windows con fuentes que no están en la mía.

Tenga en cuenta que cualquier método que no implique rasterización solo es aceptable si va a imprimir el documento redactado en papel y no lo distribuye electrónicamente, ya que el texto aún se puede recuperar de los apagones.

2. Aumente la resolución de rasterización al abrir en un editor de mapa de bits

Con respecto a la "pérdida de calidad" al abrir la página en Gimp : puede abrir directamente un archivo PDF en Gimp. Será rasterizado en el proceso. La cantidad de pérdida de calidad en el proceso depende de la resolución que elija al importar: 300 ppp debería proporcionarle una calidad muy decente (el valor predeterminado es 100).

También puede obtener buenos resultados con el convertcomando de ImageMagick si le dice que aumente la resolución:

convert -density 300x300 ...
Sergey
fuente
1
+1 y aceptado! Gracias por sugerir inkscape, hizo un trabajo razonable (no perfecto, perdió un par de objetos gráficos (sin importancia para mí)), pero muy razonable). Y el consejo también convertfue bueno: el encantamiento que usé fue convert -density 300x300y no hay pérdida de calidad.
bstpierre
+1 por mencionar GIMP puede manejar
archivos PDF
8
Advertencia a la población general: los métodos de redacción aquí que implican retener el texto sugerido aquí (por ejemplo, todos los que evitan la rasterización) no son seguros. El texto todavía se puede seleccionar desde debajo de los apagones o leer desde la fuente del archivo. Ver por ejemplo freerepublic.com/focus/f-news/2706743/posts y hackaday.com/2008/08/01/exposing-poorly-redacted-pdfs
naught101
Si bien la pregunta original se refería al envío de copias impresas únicamente, para las cuales los métodos no clasificatorios son aceptables, el voto negativo ya que esta respuesta no advierte con suficiente claridad sobre el riesgo de seguridad al distribuir el resultado electrónicamente.
Jesse Glick
55
@JesseGlick: en lugar de "castigarme" por no abordar un caso de uso que ni siquiera se menciona en la pregunta original, podría haber editado la respuesta. Eso sería más beneficioso para los futuros visitantes.
Sergey
10

Básicamente, lo que intenta hacer es resaltar / anotar un PDF, pero con cierta flexibilidad hacia la opacidad y el color del marcador (mencionó que no necesita censurar / eliminar algo, simplemente redactar). ¿Ha echado un vistazo a las respuestas aquí: cómo puedo resaltar o anotar archivos PDF?

Una de las respuestas mejor calificadas recomienda Xournal , que no se ha mencionado aquí y sería mi arma de elección. Es una herramienta que le permite hacer notas escritas a mano, pero tiene características adicionales que le permiten anotar un PDF. De forma predeterminada, guardará sus anotaciones como un archivo separado, pero también le permite exportar el PDF anotado como un nuevo PDF. Esto debería mantener el diseño, las fuentes, etc.

Con Xournal elegiría "Anotar PDF", luego usaría un marcador negro sólido para enmascarar las partes que desea redactar y "Exportar a PDF".

Hay algunas historias en Internet que sugieren que Xournal rasteriza el texto en el PDF exportado (gracias por señalar esto, MHC). Esto no parece ser cierto: con anotaciones simples, el texto permanece seleccionable y se puede buscar y el tamaño del archivo no aumenta mucho (aumentó de 205 kb a 220 kb en el ejemplo a continuación).

Para instalar, ejecutar en un terminal: sudo apt-get install xournalo simplemente seleccionarlo desde el Centro de software

Interfaz Xournal PDF exportado resultante

Tomás
fuente
Xournal es bueno, pero debe saber que solo puede exportar archivos PDF de trama, lo que significa que toda la información de texto y vector se pierde en el proceso. Si puede lidiar con eso, entonces Xournal es la aplicación que elija.
Glutanimate
1
Gracias por los comentarios, @MHC. Xournal no rasteriza, vea la respuesta revisada para más información.
Tomás
3
Lo intenté por mí mismo y tienes toda la razón. Perdón por la confusion. Había pasado un tiempo desde que usé Xournal y de alguna manera me dejó la impresión de que los documentos exportados no eran verdaderos archivos PDF. ¡Gracias por aclarar eso!
Glutanimate
1
Esto funciona bien, pero no pude encontrar una manera limpia de redactar información. Tuve que usar la herramienta de dibujo para garabatear, que se ve muy desordenada y carece de la profesionalidad que me gustaría. De lo contrario, siga con la exportación rasterizando el contenido para que no se pueda seleccionar y descubrir.
flickerfly
Para una redacción real, que reemplaza los datos textuales con imágenes, combine esta respuesta con @ balu's que usa el convertcomando ImageMajick .
colan
6

Puedes usar Okular.

sudo apt-get install okular
  1. Abra el pdf con Okular.
  2. Presione F6.
  3. Presione 8.
  4. Resalta el texto que deseas redactar.
  5. Haga clic derecho en el texto, seleccione propiedades, seleccione el "Tipo" como "Resaltar", presione Ok.
  6. Imprima el archivo en un pdf.
eharvey
fuente
44
Quizás mencione cómo hacer que el resaltado sea negro.
Equaeghe
1
Okular puede redactar con cualquier color (negro) de estas funciones: resaltado de texto, línea de mano libre y enlaces de polígono con relleno interno. Puede guardar la configuración como su propia herramienta de anotación personalizada. Utilizándolo fácilmente una y otra vez. Luego, cuando imprima el archivo en pdf, debe "forzar la rasterización" para asegurarse de que la redacción no sea reversible. Okular Versión 1.1.3
shadowbq
Es negro por defecto, funciona con la última versión de Okular. ¡Gracias!
TheFrack
5

Todos los días redacto muchos archivos PDF, así que paso mucho tiempo pensando en cómo hacerlo de la mejor manera.

Para mí, la mejor manera es dividir el PDF en un archivo PDF de 1 página, luego editar con GIMP, luego combinarlo. No uso imagemagick en todos los archivos (no lo uso en absoluto), por lo que no pierdo la capa de texto en todas las páginas, sino solo en redactado. No cargue todo el archivo PDF a la vez, ya que causa el agotamiento de la memoria.

Dividir PDF en archivos de 1 página

Divida fácilmente los archivos PDF en PDF de 1 página con esta función bash (póngalo en ~ / .bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Ahora puede ingresar split_pdf file.pdfpara obtener muchos archivos PDF.

Redactar archivos

Pero, ahora necesita editar todos estos archivos. Puedes hacerlo con gimp original-filename-*.pdf. Sugiero configurar el acceso directo en GIMP (Ventana principal-> Editar-> Acceso directo) para reemplazar el archivo (uso CTRL + R), desenfocar el filtro (por ejemplo, CTRL + D), cerrar el archivo (por ejemplo, CTRL + W) y salir de GIMP ( por ejemplo, CTRL + Q). Recuerde no cargar en GIMP a muchos archivos a la vez, pero GIMP como carga después de abrir, para que pueda usargimp original-filename-*.pdf en miles de archivos de forma segura.

Combinar archivos

Puede combinar archivos fácilmente con: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Conéctalo todo junto

Estas operaciones son muy repetitivas y aburridas, por lo que lo conecto todo en 1 script:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

La versión más reciente de este script siempre está disponible en: http://dostep.jawne.info.pl/it/bashrc

Recuerde cerrar GIMP (CTRL + Q) después de toda redacción para continuar el script.

Además, debo abrir archivos redactados (me gusta leer para verificar si todos) y cargarlos en Scribd con mi otro script: scribd_up , por lo que ahora puedo redactar muchos archivos PDF de manera muy eficiente.

Adam Dobrawy
fuente
2

Abra el PDF con la herramienta gratuita PDF-Xchange PDF Viewer . Apague el texto a ser redactado usando rectángulos negros. Impresión. Eso le proporcionará una redacción "falsa" fácil y de alta calidad.

MetaEd
fuente
Esa parece ser una herramienta win32. Déjame saber si me perdí el enlace para el puerto de Linux ...
bstpierre
3
El visor de PDF-Xchange portátil gratuito funcionará con vino.
Sabacon
Gracias, esto funcionó perfectamente para mí con vino. Las soluciones inkscape y gimp solo son realmente útiles para redacciones de una sola página.
Gearoid Murphy
2

Use LibreOffice Draw para la edición rápida que está buscando. Una vez que haya terminado, puede guardarlo como formato LibreOffice Draw o exportarlo nuevamente a formato PDF ( File> Export as PDF)

ingrese la descripción de la imagen aquí

Para poder importar archivos PDF en LibreOffice Draw, primero debe instalar el paquete libreoffice-pdfimport .

Instálelo a través del Centro de software de Ubuntu ( libreoffice-pdfimport Instalar libreoffice-pdfimport ) o mediante un terminal con sudo apt-get install libreoffice-pdfimport.

Bruno Pereira
fuente
2

También puede probar esta herramienta: https://launchpad.net/updf

Aquí está (pero de todos modos, el texto es seleccionable):

ingrese la descripción de la imagen aquí

franzlorenzon
fuente
1
uPDF es excelente ya que conserva el PDF original y su contenido de texto y svg. Sin embargo, parece tener algunos problemas con los niveles de compresión. Los PDF editados son aproximadamente 3-4 veces más grandes que el original. Gracias por publicar esto, sin embargo. No estaba al tanto de uPDF.
Glutanimate
Sí, sé que tiene algunos problemas, es un poco difícil. Esperemos que las versiones más nuevas corrijan estos problemas ... :)
franzlorenzon
Como se mencionó, uPDF tiene muchos errores (y ni siquiera deshacer / rehacer) pero todo salió bien en mi caso, ¡así que gracias!
balu
2

Recuerdo una vez que un colega y yo tuvimos que encontrar la manera de editar un par de pdf. Terminamos usando Gimp. Te comentaré los detalles ... abrimos el pdf directamente con gimp (en una terminal)

gimp the_file.pdf

Una vez que haya terminado de editar, no guardamos los cambios, en lugar de eso imprimimos en un archivo pdf ... Eso pareció funcionar bien.

maniat1k
fuente
Por alguna razón, gimp se niega a permitirme realizar modificaciones en el archivo. convertPrimero tuve que convertir con imagemagick , luego editar el archivo convertido. (Ver respuesta aceptada.)
bstpierre
ok, la solución de inkscape es válida. Pero te repito que The Gimp puede editar archivos pdf directamente. = D
maniat1k
Gimp parece funcionar con la mayoría de los archivos PDF, pero el archivo que estaba usando anoche no funcionó correctamente. Inkscape manejó ese archivo correctamente.
bstpierre
2

PDF Studio no es de código abierto y es un software que requiere compra.

En términos de esta pregunta, desde la versión 8 en adelante tiene una función de redacción manual. Los usuarios pueden seleccionar un objeto de texto y redactarlo. El contenido se elimina del PDF y se reemplaza con un rectángulo negro.

En la versión 9 del tercer trimestre de 2013, las anotaciones de redacción y la grabación también estarán disponibles para imágenes y formas.

Lilou
fuente
44
Según las preguntas frecuentes , debe divulgar su afiliación con el producto que está promocionando.
bstpierre
Aunque probablemente sea más un anuncio promocional que una respuesta, tengo que decir que PDFstudio realmente es una gran pieza de software. Puede ser un poco caro, pero sin duda es el mejor paquete de edición de PDF para Linux que existe. Asegúrese de al menos probar su versión de prueba .
Glutanimate
2

Si no desea recordar el encantamiento correcto convert, puede usar pdf-redact-tools , un script de shell que automatiza el proceso de explotar un PDF en imágenes PNG y fusionarlas nuevamente después de la redacción (usando una herramienta de su elección, por ejemplo, gimp ) Es conventiently apt-get instalable .

kynan
fuente
+1 Es producto de Micah Lee y otros de First Look Media (editor de The Intercept). Su página de manual está aquí (por ejemplo) y hay información de fondo de su lanzamiento en 2015 disponible aquí .
caw hace
2

Como muchas soluciones aquí recomiendan redactar / oscurecer a través de anotaciones (que dejan el contenido original en el pdf), recomiendo rasterizar el pdf después para eliminar realmente el contenido original. (No seas este chico )

Aquí hay una forma de hacer eso que, al mismo tiempo, mantiene la calidad y el tamaño del archivo bajos (al menos en mi caso de un montón de páginas en blanco y negro):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Nota: convertnecesita ImageMagick.

Nota 2: convertno conserva el contenido de los formularios que podría haber completado. Para que no se pierda, es posible que desee imprimir el documento "en un archivo" en algo como evinceprimero (o en cualquier aplicación que haya completado el formulario) y luego rasterizarlo.

balu
fuente
Acabo de agregar la corrección de permisos. Esta respuesta debe combinarse con la Xournal.
colan 01 de
1

La mejor manera que he encontrado para hacer esto es usar http://www.pdfescape.com . Puede realizar anotaciones, agregar texto e imágenes, dibujar un rectángulo "blanco" alrededor de las cosas que desea redactar, y puede descargarlas y guardarlas rápidamente. También funciona muy bien con documentos de varias páginas, que es algo con lo que muchas otras soluciones no funcionan bien. Por ejemplo, si abre un documento de varias páginas en Gimp o Inkscape, solo podrá abrir una página a la vez. El proceso es mucho más rápido en PDFescape. Todo el proceso para redactar un documento de 2 páginas lleva menos de un minuto.

usuario184478
fuente
1
Realmente no borra los datos que pintó. (Todavía puedo buscarlo y se "resaltará" a continuación).
Frank Nocke
0

Hay varios editores para editar documentos PDF directamente, como pdfeditconvertirlos a otros formatos vectoriales que podrían ser mejor compatibles, como pstoedit. Sin embargo, no recomendaría el uso de ninguno de ellos, ya que el riesgo de hacer algo estúpido, como pintar sobre el texto con negro y dejar los vectores en su lugar, es demasiado fácil, lo que hace que la redacción sea trivial para deshacer.

Ir del vector a la ruta de mapa de bits es la forma más segura, preferiblemente la ruta de mapa de bits de 1 bit, para evitar cualquier problema potencial con canales alfa o diferencias de color que puedan dejar el texto legible.

Si es posible, siempre debe redactar el documento original y simplemente eliminar la información, no la pintura en el PDF, ya que incluso el interletraje y el espaciado del texto alrededor del texto redactado pueden revelarlo.

Grumbel
fuente
Entiendo los problemas con la redacción adecuada, pero gracias por tomar el cuidado de señalarlos a cualquier persona que venga después. En mi caso, el PDF en sí es desechable, todo lo que busco es una copia impresa. (El PDF se eliminará tan pronto como tenga una copia impresa). FWIW, pdfeditno funcionó: cuando dibujé un rectángulo negro sobre el texto en cuestión, desmarcó el resto de la página, dejándome con un documento que constaba de un Rectángulo negro único.
bstpierre
0

Añado a la lista: Krita . No tuvo pérdida de calidad, porque al importar PDF puede definir dpi (configúrelo en 300, como dijo @Sergey). Después de editar presione "Exportar como PDF". Por último, encuentro que Krita es más intuitivo que Gimp, después de haber sido un usuario de Photoshop desde hace mucho tiempo.

jmjr
fuente
-1

Si usa LibreOffice para crear un archivo PDF, abra el documento en LibreOffice, resalte el texto a ser redactado, haga clic derecho y seleccione el carácter, seleccione Fondo y haga clic en negro. Exportar a PDF.

Dave
fuente