Tengo un PDF que contiene una imagen escaneada de un documento. Quiero guardar el contenido de este PDF como una imagen para poder ejecutarlo a través de un programa OCR que solo acepte archivos de tipo .jpg, .png y .gif.
¿Cómo guardo / convierto este PDF a uno de esos formatos de imagen?
EDITAR: Una forma de hacer esto es hacer clic en cada página. Copiar al portapapeles. Pegar en Paint.net y luego guardar. Sin embargo, esto es engorroso, ya que parece que solo puede seleccionar una página a la vez en Acrobat Reader.
%d
nombre del archivo de salida es una variable que se reemplaza con el número de página. (Es casi seguro que los números en bruto, no el número dentro del PDF.)Instala Imagemagick . Abra una ventana o terminal cmd:
La salida será 1 archivo jpg para cada página en su pdf, test-0.jpg, test-1.jpg, etc.
fuente
density
,depth
yquality
banderas que pueden ayudar a optimizar su salida. Por ejemplo:convert -density 300 -depth 8 -quality 85 a.pdf a.png
Más informaciónHay también
pdfimages
de las herramientas Xpdf (disponible en el sitio de XpdfReader ). No convertirá una página PDF completa en una imagen, sino que extraerá imágenes incrustadas de un PDF.Esto es útil si el PDF contiene texto e imágenes, y solo desea las imágenes. Además, extraerá las imágenes en su formato original, por lo que no hay pérdida de calidad (a diferencia de los programas que representan la página completa y luego la convierten a, por ejemplo, JPEG). Dependiendo de sus necesidades, esto puede ser útil.
Uso simple:
Esto leerá el archivo de entrada
mydocument.pdf
, extraerá todas las imágenes y las escribirá en archivos individuales nombradosmydocument-images-0000.jpg
,mydocument-images-0001.jpg
etc.La opción lo
-j
hace escribir imágenes comprimidas JPEG incrustadas como archivos JPEG, no como archivos PBM / PGM / PPM (que son enormes y sin comprimir). Tenga en cuenta que las imágenes aún pueden escribirse como archivos PBM / PGM / PPM, si es así como se almacenaron en el archivo de entrada PDF.fuente
pdfimages -j "yourinputfile.pdf" "outputimages"
que hará "outputimages-0000.ppm" (o "outputimages-0000.jpg" si tienen el formato correcto). Los ejemplos de .NET se pueden injertar aquí o aquíPuedes hacer esto usando Adobe Reader:
fuente
A excepción de la respuesta que menciona imágenes en pdf, todas las otras respuestas no mencionan que sus soluciones realmente transcodifican las imágenes incrustadas. Es decir, esas soluciones no solo extraen la imagen original, sino que la modifican, posiblemente en detrimento de la imagen, durante el proceso. Solo pdfimages extrae la imagen original. Esto es cierto para Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview y la mayoría de los demás software de PDF.
fuente
PDFill PDF Tools es probablemente la forma más fácil de convertir sus archivos PDF a imágenes en Windows. Le permitirá exportar todas las páginas del PDF para separar las imágenes de una sola vez. También tiene muchas otras funciones disponibles de forma gratuita, que solo están disponibles en otros visores de PDF si compra la versión comercial o "Pro".
Use el botón "Convertir PDF a imágenes" (botón # 10) en la captura de pantalla a continuación.
Si necesita concatenar las imágenes en una imagen muy alta para que solo tenga que alimentar un archivo a su programa OCR, puede usar IrfanView
fuente
Como no incluiste una etiqueta OS, incluiré una respuesta OSX:
Los archivos PDF se abren de forma predeterminada en Preview.app, que le permite usar
File -> Save-As
:fuente
También PDF Xchange Viewer (Gratis) hará la exportación a archivo. Archivo → Exportar → Exportar a imagen.
No solo eso, sino que creo que es el mejor visor de PDF gratuito para Windows, y tiene algunas buenas capacidades de marcado. Tengo una licencia para Adobe Acrobat y todavía prefiero esto a menos que esté haciendo una edición extensa, lo cual es raro.
fuente
(No libre) Acrobat profesional hace esto:
Avanzado-> Procesamiento de documentos-> Exportar todas las imágenes ...
fuente
Si el archivo tiene menos de 5 MB y no le preocupa la privacidad / confidencialidad, entonces hay un útil servicio en línea en http://www.go2convert.com/ que puede hacer muchas conversiones gráficas (incluyendo pdf a jpeg)
fuente
Si la imagen excede el tamaño de su pantalla, puede usar FastStone Capture (la función "Capture Scrolling Window") y guardar la imagen como JPEG.
fuente
Puedes consultar este artículo .
Enumera 6 formas diferentes de convertir el pdf en imágenes.
Convertir PDF a JPG (The Web Way)
Convertidores de PDF a JPG para el escritorio
fuente