Antes de comenzar a usar Ubuntu, usaba el lector Nitro PDF para extraer automáticamente imágenes de archivos PDF. ¿Hay un lector de PDF para Linux que haga esto?
Me gustaría poder extraer imágenes más rápido / más fácil que al tomar una instantánea.
pdfimages
hacerlo mejor / peor que NitroPDF?Respuestas:
Utilizar
pdfimages
pdfimages
es una herramienta de extracción de imágenes PDF que guarda las imágenes en un archivo PDF en formato PPM, PBM, JPEG o JPEG 2000.Es una parte del
poppler-utils
paquete, que deberá instalar.Uso:
pdfimages [options] <PDF-file> <image-root>
Ejemplo: a continuación se extraen todas las imágenes de un archivo PDF y se guardan en formato JPEG.
Guardará imágenes de archivos PDF
in.pdf
en archivos/tmp/out-000.jpg
(o/tmp/out-000.pbm
; ver más abajo)/tmp/out-001.jpg
, etc.La página del manual de pdfimages explica:
fuente
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
conmutador solo es compatible con las revisiones recientes de poppler-utils. Por ejemplo, si todavía está en 12.04 no podrá acceder a esta opción-all
vaya a los formatos PNM. No tienen pérdidas y puede procesar las imágenes, por ejemplo, en PNG.$ pdfimages -list <PDF-file>
para verificar el formato original en la columna "enc", para que no tenga que volver a codificar la imagen en otro formato.A menudo uso Inkscape para esto. Cargue la página y elimine todas las demás cosas. La ventaja es que puede obtener imágenes vectoriales en SVG y modificarlas a su elección.
fuente
Tengo un archivo PDF de doble columna con imágenes incrustadas creadas con LaTeX donde las imágenes originales se proporcionaron como EPS. Probé la solución propuesta basada en
pdfimages
, pero desafortunadamente, no devolvió ninguna imagen. Entonces intenté usar Inkscape, pero las imágenes SVG que generó estaban distorsionadas y tampoco tuve suerte de exportarlas como EPS.El software que funcionó para nosotros fue el MasterPdfEditor .
Aquí está el procedimiento.
El resultado es de muy alta calidad, pero el software no es gratuito. Hay una versión de demostración que "le permite probar todas las funciones", pero viene con "la adición de una marca de agua en el archivo de salida". Para ser sincero, no noté ninguna marca de agua en el PDF producido.
fuente
También puede probar pdfmod. Es una GUI (interfaz gráfica) que puede extraer imágenes y realizar otras manipulaciones básicas de pdf.
fuente
Si lo que necesita es una imagen recortada en formato pdf / eps, extraiga una página con la imagen usando
pdfmod
(como lo sugiere To Do).Luego
pdfcrop
, puede recortarlo correctamente configurando los márgenes por prueba y error:fuente
Uso pdfimages, que es una herramienta de línea de comandos y funciona muy bien para mí. Es muy fácil de usar y puede usar la opción --help para obtener más información sobre su uso. Yo uso Ubuntu y viene preinstalado. Si sus archivos PDF están encriptados o protegidos con contraseña, hay opciones para eso, por lo que esta herramienta funciona muy bien. Puedes leer más sobre pdfimages aquí
fuente
Con pdfimages la imagen extraída puede estar en dos o más partes. Una forma sencilla de volver a unirlos sin preocuparse por los formatos extraídos es importar las partes en LibreOffice Draw, recortar con el diálogo de recorte de imagen, colocar las partes, ajustar el tamaño de página y exportar en el formato que prefiera.
fuente
Si desea recortar una imagen de un pdf con un visor de pdf, puede probar okular. Puede recortar cualquier cosa (textos o imágenes) en formato png o jpeg. Si desea extraer imágenes en formato png desde un pdf, puede hacerlo con un comando mínimo con pdftohtml. Convierte pdf a html más imágenes. Aquí puede encontrar un ejemplo: https://www.youtube.com/watch?v=CG1rf7k3xo8 . Si desea extraer muchas imágenes de un pdf, le sugiero que pruebe esto.
fuente
Software utilizado: Xreader OS: Antergos
Pasos:
fuente