Contar páginas BW / color en PDF

23

Tengo un documento PDF de 100 páginas que necesito imprimir. Mi imprenta necesita que me digan qué páginas contienen color. No quiero escanear manualmente. ¿Hay algún programa que detecte páginas con color y pueda superar el número de página?

Ninguna
fuente
1
¿Sistema operativo?
frabjous

Respuestas:

25

Encontré esto en http://root42.blogspot.de/2012/10/counting-color-pages-in-pdf-files.html

gs -o - -sDEVICE=inkcov input.pdf | grep -v "^ 0.00000  0.00000  0.00000" | grep "^ " | wc -l

Funcionó bien para mí

El recuento total de páginas se puede encontrar por

pdfinfo input.pdf | grep Pages:
Ulrik
fuente
Este en línea responde a la pregunta "¿Hay un programa que detecte páginas con color y pueda superar el número de página?" gs -o - -sDEVICE=inkcov input.pdf |tail -n +4 |sed '/^Page*/N;s/\n//'|sed -E '/Page [0-9]+ 0.00000 0.00000 0.00000 / d'
Fredrik Erlandsson
8

En Linux (y probablemente en Mac / otro Unix), el siguiente script BASH muy breve parece ser el truco:

 #!/bin/bash
 file="$1"
 for page in $(identify -density 12 -format '%p ' "$file") ; do
     if convert "$file[$((page-1))]" -colorspace RGB -unique-colors txt:- | sed -e 1d | egrep -q -v ': \(\s*([0-9]*),\s*\1,\s*\1' ; then
         echo $page
     fi
 done

Asigne un nombre similar al script coloredpages.sh, hágalo ejecutable chmod +x coloredpages.shy luego ejecútelo, ./coloredpages.sh "pdfname.pdf"y debería devolver una lista de números de página.

Esto requiere que ImageMagick y probablemente Ghostscript estén instalados. Y no es la cosa más rápida del mundo.

Lo siento, no tengo idea de cómo adaptar esto para Windows (sin Cygwin o similar, de todos modos).

precioso
fuente
Gracias, lo intentaré cuando tenga un linux ejecutándose. Puedo encontrar una mejor imprenta que pueda detectarlo.
Ninguno
3

Al tener la misma tarea que el OP y trabajar en Windows, he encontrado que la siguiente solución funciona de manera rápida y agradable: el SDK de Spool File Page Counter no es gratuito, pero la versión de evaluación aún funciona. Descargue el archivo zip del enlace anterior, descomprímalo y ejecútelo bin/C#_ParsingTest yourfile.pdf. Verás algo como

Page   1 is [   BW]
Page   2 is [Color]
...
Page 143 is [Color]
============
Statistics: bwPageCount=99, colorPageCount=44

El conteo rápido de PDF mencionado en otra respuesta aquí requiere instalación (que para mi trabajo de una sola vez --- impresión de tesis) es una desventaja. Sin embargo, también hace el trabajo y proporciona una GUI. Después de instalarlo, ejecútelo, arrastre y suelte el archivo PDF en él, verifique Color Pages CountingConfiguración / Opciones, luego haga clic en el Page count files in listbotón.

Curiosamente, los resultados de mi tesis difieren en 1 página (99/44 vs. 100/43). Creo que esto se debe a que alguna figura (hice todo con Inkscape) en realidad es en blanco y negro, pero se describe como color en los metadatos. No estoy seguro. Lo que no encontré en Rapid PDF Count es una lista de todas las páginas en color / blanco y negro, por lo que no puedo decir la fuente exacta de esta discrepancia.

texnic
fuente