¿Cómo guardo un archivo PDF de imagen como una imagen?

33

Tengo un PDF que contiene una imagen escaneada de un documento. Quiero guardar el contenido de este PDF como una imagen para poder ejecutarlo a través de un programa OCR que solo acepte archivos de tipo .jpg, .png y .gif.

¿Cómo guardo / convierto este PDF a uno de esos formatos de imagen?

EDITAR: Una forma de hacer esto es hacer clic en cada página. Copiar al portapapeles. Pegar en Paint.net y luego guardar. Sin embargo, esto es engorroso, ya que parece que solo puede seleccionar una página a la vez en Acrobat Reader.

Chico
fuente

Respuestas:

20

Preste mucha atención a la respuesta de pooryorick , en la que señala cómo la respuesta de sleske es en realidad una respuesta mucho mejor para este problema en particular.


Usa GhostScript . Este comando funciona para mí:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Hay varios pseudodispositivos png que se diferencian en la profundidad de color: pngmono, pnggray, png16, png256, png16m y pngalpha. Elija el que más le convenga.

También puede usar jpeg, pero a menos que tenga un problema de espacio en disco, desea obtener la mayor calidad posible para su OCR, y eso no es jpeg.

GhostScript ya no tiene soporte para gif, pero no puedo imaginar por qué lo necesitarías, con el soporte de png256.

wfaulk
fuente
Me encanta GhostScript, y si desea la conveniencia de una GUI para configurar opciones, ver, etc. intente GSview pages.cs.wisc.edu/~ghost/gsview
Dennis
¿La salida será una gran imagen?
Xonatron
1
@ Xonatron: No. Una imagen por página. El %dnombre del archivo de salida es una variable que se reemplaza con el número de página. (Es casi seguro que los números en bruto, no el número dentro del PDF.)
wfaulk
20

Instala Imagemagick . Abra una ventana o terminal cmd:

convert myfile.pdf myfile.jpg

La salida será 1 archivo jpg para cada página en su pdf, test-0.jpg, test-1.jpg, etc.

DaveParillo
fuente
+1 para ImageMagick, pero -2 por sugerirlo para el trabajo incorrecto. JPEG es bueno para las fotos, pero es el peor formato para usar cuando tienes egdes nítidos y altos contrastes (como normalmente lo haces con texto / caracteres en negro sobre fondo blanco). Además, ImageMagick no hace el trabajo de conversión en sí mismo, usa Ghostscript en segundo plano como su esclavo "delegado". Entonces, hacerlo con Ghostscript directamente le da más control sobre los parámetros utilizados. ¡Y luego elija TIFF (no JPEG) como formato de salida, por el amor de Dios!
Kurt Pfeifle
1
Nota sobre Windows, asegúrese de instalar Ghostscript de 32 bits primero.
Usuario
2
Sé consciente de la density, depthy qualitybanderas que pueden ayudar a optimizar su salida. Por ejemplo: convert -density 300 -depth 8 -quality 85 a.pdf a.png Más información
Nick
13

Hay también pdfimagesde las herramientas Xpdf (disponible en el sitio de XpdfReader ). No convertirá una página PDF completa en una imagen, sino que extraerá imágenes incrustadas de un PDF.

Esto es útil si el PDF contiene texto e imágenes, y solo desea las imágenes. Además, extraerá las imágenes en su formato original, por lo que no hay pérdida de calidad (a diferencia de los programas que representan la página completa y luego la convierten a, por ejemplo, JPEG). Dependiendo de sus necesidades, esto puede ser útil.


Uso simple:

pdfimages -j -list mydocument.pdf mydocument-images

Esto leerá el archivo de entrada mydocument.pdf, extraerá todas las imágenes y las escribirá en archivos individuales nombrados mydocument-images-0000.jpg, mydocument-images-0001.jpgetc.

La opción lo -jhace escribir imágenes comprimidas JPEG incrustadas como archivos JPEG, no como archivos PBM / PGM / PPM (que son enormes y sin comprimir). Tenga en cuenta que las imágenes aún pueden escribirse como archivos PBM / PGM / PPM, si es así como se almacenaron en el archivo de entrada PDF.

sleske
fuente
Como referencia, el uso simple es el pdfimages -j "yourinputfile.pdf" "outputimages"que hará "outputimages-0000.ppm" (o "outputimages-0000.jpg" si tienen el formato correcto). Los ejemplos de .NET se pueden injertar aquí o aquí
drzaus
Una advertencia es que es posible que no pueda guardar el archivo como JPG, sino más bien como un PPM
drzaus
11

Puedes hacer esto usando Adobe Reader:

  1. Haz clic en la imagen. Será resaltado.
  2. Copie (Ctrl-C) y péguelo en Paint.
  3. Guardar como cualquier tipo de archivo que desee.
Hemant
fuente
2
Es interesante saber que Adobe Reader tiene una configuración para anular el ppp de las imágenes tomadas con la herramienta de instantáneas, cuando se configura a 300 ppp, obtendrá instantáneas que están listas para imprimir (de forma predeterminada, se toma la resolución de la pantalla, que generalmente es demasiado baja para reutilizar en otros trabajos)
Stijn Sanders
3
+1 por simplicidad. La mayoría de los lectores de PDF le permiten hacer esto.
Decio Lira
44
¿Qué pasa si su PDF tiene 10000 páginas de imágenes? ¿Tienes que hacer esto 10000 veces?
Guy
9

A excepción de la respuesta que menciona imágenes en pdf, todas las otras respuestas no mencionan que sus soluciones realmente transcodifican las imágenes incrustadas. Es decir, esas soluciones no solo extraen la imagen original, sino que la modifican, posiblemente en detrimento de la imagen, durante el proceso. Solo pdfimages extrae la imagen original. Esto es cierto para Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview y la mayoría de los demás software de PDF.

pooryorick
fuente
Dado el contexto de la pregunta, este es realmente un muy buen punto.
wfaulk
FWIW, "PDFill PDF Tools" le permite configurar el DPI para guardar como imagen, muy útil. Por lo tanto, cada página (a partir de texto, imágenes, cualquier objeto) se guarda, por ejemplo, en un PNG de alta resolución a 4961x6520.
Chris O
4

PDFill PDF Tools es probablemente la forma más fácil de convertir sus archivos PDF a imágenes en Windows. Le permitirá exportar todas las páginas del PDF para separar las imágenes de una sola vez. También tiene muchas otras funciones disponibles de forma gratuita, que solo están disponibles en otros visores de PDF si compra la versión comercial o "Pro".

Use el botón "Convertir PDF a imágenes" (botón # 10) en la captura de pantalla a continuación.

Captura de pantalla de PDFill PDF Tools

Si necesita concatenar las imágenes en una imagen muy alta para que solo tenga que alimentar un archivo a su programa OCR, puede usar IrfanView

robar
fuente
tenga en cuenta que esto instalará dos herramientas diferentes en su sistema. El principal es PDFill Editor, que es el que no necesita. Vaya al menú de inicio para abrir este. La captura de pantalla me salvó al darme cuenta de que algo estaba mal antes de desinstalarlo.
ufotds
Sí, supongo que no mencioné que también instala una versión shareware de PDFill Editor, así como una impresora PDF. Cualquier archivo creado con PDFill Editor tendrá una marca de agua a menos que compre el editor por $ 19.99, pero la utilidad PDFill PDF Tools Free no requiere ninguna compra. En la versión que tengo, no puede desinstalar PDFill Editor sin también desinstalar PDFill PDF Tools Free, pero tener instalado PDFill Editor no daña nada.
robar
2

Como no incluiste una etiqueta OS, incluiré una respuesta OSX:

Los archivos PDF se abren de forma predeterminada en Preview.app, que le permite usar File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • PELEA
lago
fuente
1

También PDF Xchange Viewer (Gratis) hará la exportación a archivo. Archivo → Exportar → Exportar a imagen.

No solo eso, sino que creo que es el mejor visor de PDF gratuito para Windows, y tiene algunas buenas capacidades de marcado. Tengo una licencia para Adobe Acrobat y todavía prefiero esto a menos que esté haciendo una edición extensa, lo cual es raro.

wfaulk
fuente
Esto parecía prometedor, hasta que descubrí que la opción de exportar a imagen está desactivada para archivos PDF protegidos con contraseña.
Mitch
1

(No libre) Acrobat profesional hace esto:

Avanzado-> Procesamiento de documentos-> Exportar todas las imágenes ...

ufotds
fuente
0

Si el archivo tiene menos de 5 MB y no le preocupa la privacidad / confidencialidad, entonces hay un útil servicio en línea en http://www.go2convert.com/ que puede hacer muchas conversiones gráficas (incluyendo pdf a jpeg)

sgmoore
fuente
Acabo de intentarlo y me dio este mensaje de error "¡Lo siento! Esta imagen no se pudo convertir correctamente".
Guy
-1

Si la imagen excede el tamaño de su pantalla, puede usar FastStone Capture (la función "Capture Scrolling Window") y guardar la imagen como JPEG.

texto alternativo

Garfio
fuente
Esa es una forma muy indirecta de tomar una imagen. OP ya tiene una mejor solución (marcar página en Acrobat).
sleske