Tengo el problema de que algunos usuarios creen archivos PDF muy grandes. Por otro lado, he enviado PDF desde nuestras máquinas de fax que son realmente de tamaño pequeño y totalmente imprimibles. Mi pregunta es
- ¿Hay alguna manera de encontrar la resolución (DPI) del PDF? Busqué en internet, no pude encontrar ninguna respuesta. Verificó las propiedades del archivo, esta información no se almacenó allí, al menos en mi caso.
- ¿Cuál es la resolución óptima de convertir un archivo de texto a PDF de imagen? ¿96 ppp, 300 ppp o más?
- Pregunta divertida ¿Puedo cambiar el tamaño de un PDF que se escaneó con ppp alto a ppp más pequeño?
Sé que algunas respuestas pueden no estar disponibles, ya que busqué en Internet y no pude encontrar las respuestas.
Nota: Mi PDF son completamente imágenes, texto a imágenes. También estoy familiarizado con primoPDF (gratis), algo con lo que puedes experimentar
pdf
images
resolution
dpi
hk_
fuente
fuente
Sé que no desea extraer los datos de la imagen, pero esta es probablemente la única forma de averiguar la resolución original.
En * nix, si tiene ImageMagick's
identify
y Xpdf instalados 1 :¿Dónde
test.pdf
está su entrada PDF? Los archivos de salida se escriben entest-000.jpg
,test-001.jpg
etcétera. Esto le daría el tamaño original de todas las imágenes contenidas en ese PDF 2 .Ejemplo de salida para un archivo PDF que solo contiene una imagen grande:
1) Windows también tiene estos, pero el guión sería diferente, por supuesto.
2) Tenga en cuenta que las imágenes realmente no llevan información DPI. Simplemente hablando: eso es solo algo utilizado para imprimir y las imágenes no necesitan una medida inherente de DPI.
En general, cualquier cosa que desee imprimir debe ser de 300 ppp o más. La mayoría de las impresoras también manejarán una resolución más alta.
fuente
pdfimages -list test.pdf
. En lugar de generar archivos, esto enumera el tamaño y el tipo de imagen. Aún así no le da resolución explícitamente, pero evita crear archivos de salida.pdfimages -list
proporciona información explícitax-ppi
yy-ppi
muchas otras.pdfimages
puede ser bastante diferente (por ejemplo, cuando la imagen es más grande que su área visible, en un PDF producido porscribus
). (Desafortunadamente, realmente no tengo tiempo para presentar un informe de error ahora.)Por alguna razón, la última versión de pdfimages que puedo actualizar en mi CentOS es la versión 3.04.
Por lo tanto, no tengo la opción -list como se indicó en las respuestas anteriores. Sin embargo, la imagen de prueba creada a partir de imágenes en PDF basadas en la respuesta de slhck contiene la respuesta deseada.
Identificar -verbose test-0000.jpg | más
Por lo tanto, el dpi se muestra explícitamente en la sexta línea usando la opción -verbose en el comando de identificación.
Entonces, la respuesta de slhck se puede modificar a lo siguiente.
pdfimages -j test.pdf test && para el archivo en $ (find. -name "test * .jpg"); identificar -verbose "$ archivo" | awk 'NR == 6'; hecho
En otra nota, intenté correr
Identificar -verbose test.pdf
Parece que Imagemagick siempre asume 72 ppp, por lo que la información impresa aquí parece ser incorrecta.
fuente
Un archivo PDF no tiene una resolución inherente, cada imagen ráster dentro de él (si la hubiera) tendrá su propia resolución. No conozco una manera simple de extraer un solo número para la resolución mediana / modal de XObjects de imágenes incrustadas.
fuente
Esto funcionó con un pdf generado a partir de un mfp de Kyocera ... Esto probablemente solo sea válido para imágenes de página completa como escaneos.
Archivo> Propiedades - Pestaña Descripción - Tamaño de página. Mi ejemplo decía 8.5x11.0 in.
Abra el pdf con un editor de texto (bloc de notas), busque
/width
y/height
Ejemplo:
Mi PDF fue escaneado a una resolución de 600x600.
Puede omitir los primeros 2 pasos si conoce el tamaño del documento (normalmente A4 es 8.27x11.69).
fuente
Para responder a su segundo punto, además de la mención de @slhck sobre dpi de impresora, 300 ppp también es el número mínimo recomendado típico para OCR con tamaños de fuente de 10 + pt.
Además, una pantalla de computadora portátil moderna de 15 "4K también tiene aproximadamente 280PPi, por lo que si desea ver un A4 completo en la pantalla (horizontal) no hay punto de escaneo a más de ~ 320 ppp, porque cualquier documento más alto que eso será reducido. Por supuesto, esto no importa si planea hacer un acercamiento, entonces es posible que necesite más ppp.
Para responder a sus otros dos puntos, hoy en día al menos puede usar Acrobat Pro para verificar la resolución y el DPI de la imagen, y también puede editarla.
fuente