Mi problema es que tengo la tarea de extraer imágenes de un archivo PDF de 640 páginas.
La mayoría de los cuales son gráficos y tablas con textos. Hacer una simple copia y pegar hace que la imagen pierda su resolución y los textos se vuelvan borrosos ya veces ilegibles.
¿Conoces una mejor manera de extraer imágenes de un archivo PDF sin afectar la resolución?
Respuestas:
Desde la suite XPDF (que es software libre y de código abierto) puede usar la
pdfimages.exe
herramienta CLI para extraer todas las imágenes de un PDF, o solo todas las imágenes de un rango de páginas. Aquí un ejemplo para extraer todas las imágenes de las páginas 33-36:El
-j
tratará de extraer imágenes JPEG incrustados como archivos JPEG. Todas las demás imágenes se emiten como PPM (pixmaps portátiles). ¡Atención, los PPM están totalmente descomprimidos!fuente
./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
Esto es muy fácil de usar
evince
(El visor de documentos) en Ubuntu. Simplemente abra el pdf usando,evince
luego desmarque la ventana, márquelo,Always on top
luego arrastre y suelte la imagen en la carpeta que desee.fuente
Extraer las imágenes de resolución original es una de las funciones gratuitas de Solid Framework SDK, por lo que si crea su solución en C #, esta es: http://www.soliddocuments.com/features.htm?product=SolidFramework
La aplicación de muestra que ilustra esta característica también es gratuita si necesita una solución por lotes GUI: http://www.pdf-internals.com/download.htm?product=SolidPDFMechanic
(Estoy con documentos sólidos)
fuente
(1) Puede abrir el archivo en Word 2013 (solo use Archivo - Abrir), donde puede copiar la imagen. La resolución es lo suficientemente buena para imprimir, pero no estoy seguro si es la misma que la original.
(2) El visor gratuito SumatraPDF (muy bueno si usa LaTeX) tiene una opción de menú "Copiar imagen" cuando hace clic derecho en la imagen. Creo que conserva la resolución (aunque vi archivos de los que no pude copiar las imágenes).
(3) Adobe Acrobat X , en Archivo, tiene Guardar como otro - Imagen, y por defecto usa alta resolución (en los casos en que lo intenté fue la resolución original).
(4) En Perl , hay más de una forma, por ejemplo, lea aquí y mencione especialmente el programa para extraer imágenes JPEG de cualquier cosa , que funcionó perfectamente para mí y definitivamente extrae las imágenes JPEG de resolución original.
fuente
PHOTOSHOP! Abre el PDF en Photoshop. (Usando Photoshop CC en Windows 7)
fuente
No, copiar y pegar debe conservar la resolución original del recurso incrustado; lo más probable es que se trate de una imagen de baja resolución que se redujo dentro del PDF, por lo que cuando se exporta, se ve peor de lo que es.
Intente reducirlo y / o hacerlo del mismo tamaño que en el PDF y en realidad debería ser el mismo.
Alternativamente, (y la peor opción), vaya al 100% de zoom y tome una captura de pantalla o use la herramienta de recorte en Windows Vista / Windows 7.
NOTA: las imágenes en
.PDF
s generalmente se reducen / comprimen en el momento en que se convierten a.PDF
, sin embargo, una vez que se ha comprimido, debería poder extraer con la misma calidad quePDF
, no peor.fuente
¿Qué software de visualización de PDF está utilizando?
Al usar un programa de edición / creación de PDF , como Adobe Acrobat Pro , debería poder extraer las imágenes incrustadas tal como están en el archivo PDF *. Puede obtener una versión de prueba gratuita del sitio de Adobe (para Windows y Mac), que puede usar solo con un propósito.
* siempre y cuando no estén protegidos, en cuyo caso tendrás que ... er, no voy a ir allí ...
fuente
Podrías usar Imagemagick para convertir todas las páginas PDF para separar archivos de imagen (aunque no estoy seguro de cuánto tiempo tomará hacer un documento tan grande, ¡o si será capaz de hacer frente!) Y luego recortar lo que quieras. Podría valer la pena hacer una prueba con esto, ya que al menos descubrirá si la resolución de las imágenes incrustadas es correcta para lo que necesita.
fuente
La mejor manera es usar Adobe Acrobat Pro (2010 o versiones más recientes). Vaya a Archivo -> Guardar como -> Más opciones -> PostScript encapsulado y luego haga clic en Guardar.
fuente
Si tiene Acrobat pro, esta es, con mucho, la forma más sencilla de tomar una instantánea de alta resolución (configúrela a la altura que desee). En preferencias / general marque la casilla que dice ' usar resolución fija para herramienta de instantáneas ' y configure la resolución a su gusto, por ejemplo, 300ppi o incluso más. Luego tome una instantánea (herramientas / herramienta de selección y zoom / instantánea) y copiará una copia de alta resolución en su portapapeles. Luego pégalo desde tu portapapeles donde quieras. Funciona genial.
Para ver una descripción más detallada, haga clic en este enlace ...
respuesta detallada de alguien con capturas de pantalla
fuente
Por lo general, extraigo imágenes abriendo los archivos pdf en Adobe Illustrator y luego los copio y pego en InDesign. La resolución se conserva.
fuente
Adobe Acrobat Pro
Archivo> Guardar como utilizará la configuración Convertir de PDF en "Editar> Preferencias"
[Convertir desde PDF] permitirá [Editar configuración ...] para cada formato de archivo
Lo mejor dependerá de las imágenes de origen y la resolución que se utilizaron para crear el PDF.
Pero puede obtener resultados bastante buenos editando la configuración TIFF sin pérdidas
Establezca la resolución en 1200 o más (si Save Fails lo establece más bajo) luego use el archivo original> SaveAs para renderizar el archivo PDF en archivos individuales de alta resolución
No es la mejor manera, pero es mucho mejor que renderizar como un tipo de documento diferente.
Los archivos serán muy grandes, pero más adecuados para cortar y pegar
fuente
En una Mac, puede exportar imágenes o una página completa desde la Vista previa y obtener la resolución completa. Se le preguntará qué resolución desea en un diálogo.
fuente
En Adobe InDesign, puede usar el comando 'Colocar' para importar un archivo PDF. Si desea importar páginas específicas, active la casilla de verificación Mostrar opciones de importación en el cuadro de diálogo que aparece después de hacer clic en el comando Colocar. Arrastre y cambie el tamaño del marco para que lo que necesita como imagen de alta resolución encaje en la página. Es posible que deba cambiar el tamaño del tamaño de página del documento de acuerdo con la relación de aspecto de la imagen. Una vez que esté satisfecho con lo que ve, use el comando Exportar y seleccione PDF de alta calidad. Esto creará un PDF de alta resolución que puede imprimir o usar en documentos de Latex.
fuente