Tengo un archivo PDF que fue el resultado del escaneo de un libro.
En este archivo, 2 páginas del libro corresponden a 1 en el PDF. Entonces, cuando veo una página en el archivo PDF, en realidad veo 2 páginas del libro.
( original )
Me gustaría saber si hay alguna forma de convertir este archivo a otro PDF donde 1 página del libro corresponde a 1 página del PDF, es decir, la situación normal.
Puede usar
mutool
una herramienta de línea de comandos MuPDF (sudo apt-get install mupdf-tools
):También puede usarlo
-y
si desea realizar una división vertical.fuente
mupdf-tools
(so ..sudo apt-get install mupdf-tools
).mutool clean input.pdf output.pdf 2-N
Yo usaría Briss . Le permite seleccionar varias regiones de cada página, cada una de las cuales convertir en una nueva página.
fuente
Otra opción es ScanTailor . Este programa es particularmente adecuado para procesar varios escaneos a la vez.
apt-get install scantailor
Desafortunadamente, solo funciona en entradas de archivos de imagen, pero es lo suficientemente simple como para convertir un PDF escaneado a un jpg. Aquí hay una línea que utilicé para convertir un directorio completo de PDF en jpgs. Si un PDF tiene n páginas, crea n archivos jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
Tenía capturas de pantalla listas para compartir, pero no tengo suficiente representante para publicarlas.
ScanTailor sale a tif, por lo que si desea que los archivos vuelvan a estar en PDF, puede usar esto para crear un PDF para cada página.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Luego, puede usar este one-liner o una aplicación como PDFShuffler para fusionar cualquiera o todos los archivos en un PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf
fuente
Aquí hay un script de Python para esto.
https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c
fuente
Sejda puede hacerlo utilizando su interfaz web o la interfaz de línea de comandos (código abierto). La tarea se llama
splitdownthemiddle
fuente
Puede usar okular o cualquier lector de pdf y luego usar imprimir para archivar y seleccionar opciones y copias-> páginas. Seleccione sus páginas interesadas y luego imprima. Cortará las páginas seleccionadas. Simple y fácil !!
fuente
Una solución de línea de comando usando ImageMagick:
Divide el PDF en imágenes individuales:
Divida las imágenes de cada página en una imagen izquierda y derecha:
Cambie el nombre de los
page-###-split-#.png
archivos a solo001.png
,002.png
etc.Combine las imágenes de la página resultante en un PDF nuevamente:
Fuentes: (también incluye variaciones y más consejos)
Recorte y divida el escaneo de libros en 3 comandos , aquí modificado para usar un
for
comando de bucle para evitar problemas de memoria.Respuesta: Cambiar el nombre de los archivos en una carpeta a números secuenciales , junto con este comentario
Respuesta: ImageMagick: convertir se cierra después de algunas páginas , en caso de que se encuentre con los límites de memoria de ImageMagick (lo cual hice).
fuente
Hay un maravilloso programa scankromsator. Es gratis y funciona bastante bien a través del vino. Más información aquí .
fuente