¿Hay herramientas disponibles para recortar los márgenes de PDF?

44

Tengo un libro electrónico que intento leer en formato PDF en un Kindle. Desafortunadamente, los encabezados y pies de página tienen cierto contenido (número de página e información de derechos de autor, respectivamente) que impiden que el dispositivo escale el texto real para que coincida con el área de visualización del área utilizable, lo que deja el contenido real demasiado pequeño para leer.

Hay varias herramientas disponibles que recortarán los espacios en blanco, pero el Kindle ya lo hace; mi objetivo, por el contrario, es eliminar el material impreso fuera de un cuadro delimitador definido, y la única herramienta que he encontrado para este propósito es un software comercial moderadamente caro.

Probablemente podría generar una máscara en Inkscape; divida las páginas individuales usando pdftk, aplique la máscara a cada página individualmente (salida a postscript), y recombine los numerosos archivos postscript en un solo PDF. Sin embargo, estos pasos de decodificación / recodificación serían bastante desafortunados en términos de tamaño del documento; algo capaz de funcionar con un poco más de delicadeza sería ideal.

Tengo a mano todos los principales sistemas operativos (Windows, varias distribuciones modernas de Linux, una Mac, etc.) por lo que las soluciones no necesitan estar limitadas por la plataforma.

Sugerencias?

(He informado el problema al autor, quien lo mencionó a su editor, que no ha hecho nada sobre el tema en el transcurso de más de un mes, lo que hace que el enfoque de trabajo cero sea evidentemente improductivo).

Charles Duffy
fuente

Respuestas:

45

Prueba BRISS . Gratis, de código abierto y multiplataforma. Hay una buena discusión al respecto en los foros de MobileRead .

precioso
fuente
44
Esa es una hermosa pieza de software; ¡Gracias!
Charles Duffy el
1
¡Irreal! gran programa
Fidel
PDF abierto, seleccionó automáticamente el área que se recortará, se guardará en un nuevo archivo agregando _cropped al nombre del archivo, básicamente no hice nada: ¡una aplicación increíble!
Rush Frisby
Esta herramienta conserva todos los gráficos vectoriales PDF ==> Hacer zoom en trabajos como antes de recortar. Exactamente lo que necesitaba.
kiltek
1
Briss es excelente porque funciona automáticamente y casi siempre hace un buen trabajo. En máquinas Linux, puede obtener el resultado con un comando breve en pocos segundos con "briss myfile.pdf". Simplemente agregue la siguiente línea a su archivo ~ / .bashrc, adaptándolo al directorio de instalación de briss: briss () {java -jar ~ / bin / briss-0.9 / briss-0.9.jar -s "$ 1"; }
dominecf
10

Como se mencionó en otra respuesta, BRISS es genial. Otra herramienta realmente útil es k2pdfopt ( http://www.willus.com/k2pdfopt/ ). Esta herramienta es realmente genial para tomar un pdf y optimizarlo para el Kindle (o cualquier dispositivo con pantalla más pequeña). Funciona muy bien para el papel científico de 2 columnas, ya que refluye el texto manteniendo la ecuación y las imágenes.

Jean-Philippe Jodoin
fuente
4

Como ya se señaló, k2pdfopt es una gran herramienta.

Si no le importa romper su Kindle (y posiblemente anular su garantía) también existe la opción de usar esta herramienta directamente en su lector. Esto se implementa mediante tres tenedores del mismo paquete de software:

Se ocupan de múltiples columnas, permiten el reflujo de texto y el cambio del tamaño de fuente. Incluso logran no destruir fórmulas e imágenes científicas al refluir.

En este momento hay problemas menores como espacios faltantes entre dos palabras de un salto de línea, pero las considero sin problemas. Tal vez se arreglen en una de las próximas versiones.

Tim
fuente
3

Puede usar ScanTailor para una herramienta más poderosa. Esta herramienta no solo recorta automáticamente los márgenes, sino que también puede agregar más (en caso de que alguien llegue a esta pregunta para la última). A continuación se muestra el contenido de su página wiki Diseño de página :


En esta etapa, puede ajustar los márgenes agregados al cuadro de contenido. Hay dos tipos de márgenes: duro y blando.

Margen duro: es el que se encuentra entre las líneas continuas. Son establecidos por el usuario. Puede moverse sobre cualquier línea continua, ya sea un borde interno o externo, o establecer los márgenes a través de valores numéricos.

Margen suave: es el que se encuentra entre la línea continua y la línea de puntos. Estos márgenes se agregan automáticamente para llevar el tamaño de la página al mismo tamaño que otras páginas. Si ve una línea punteada, esto significa que en algún lugar del proyecto hay una página con ese ancho (área utilizable de margen duro + margen) y (posiblemente otros) con esa altura.

Esta es una página grande que causa márgenes suaves en todas las otras páginas, aunque solo sea por no nivelarlas.

La alineación opcional se define con precisión, agregue un margen suave y, si agrega, con cualquiera de las partes.

Ooker
fuente
No parece funcionar para archivos PDF
Oleksiy
Bueno, sí, primero tienes que exportarlo a imágenes
Ooker
Y luego convertirlos de nuevo a PDF. Es una exageración, especialmente para archivos PDF con cientos de páginas, como libros y libros de texto.
Oleksiy
@Oleksiy bien, exagerar o no depende de su necesidad después de todo. Si solo necesita el Bloc de notas, entonces seguramente Word es una exageración. Pero algunas personas se dan cuenta de que el Bloc de notas no es lo suficientemente bueno para ellos. Es por tener que lidiar con libros y libros de texto que necesito esta herramienta
Ooker
1

También tuve este problema con mi PDF escaneado (no inglés) de 1200 páginas. Todas las herramientas, incluido Adobe Acrobat (IX a XI) no pudieron recortar el espacio en blanco circundante. El margen de la página impar difiere del de las páginas pares. Para empeorar esto, el tamaño del margen era inconsistente. Como señaló @frabjous , Briss ayudó. Sin embargo, cuando se superpusieron todas las páginas del documento, se observó que no se puede aplicar un recorte ya que no había ningún espacio en blanco efectivo en general (debido a márgenes inconsistentes)

La única solución era dividir el documento PDF en páginas individuales, ejecutarlo en Briss para eliminar márgenes y recombinar. Los pasos que seguí son:

  1. Dividí este documento en páginas individuales con Adobe Acrobat IX haciendo clic en lo Document->Split documentque abrió el siguiente cuadro de diálogo: ingrese la descripción de la imagen aquí Esta acción creó 1200 archivos PDF individuales.
  2. Luego creé un archivo por lotes con el siguiente contenido:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Coloca este archivo por lotes en el mismo lugar donde se colocan los 1200 archivos PDF y ejecuta el archivo por lotes.
  4. Nuevamente, utilicé Adobe Acrobat IX para unir todos los archivos PDF en un solo archivo y listo, tenía un PDF con todas sus páginas con márgenes blancos mínimos que ahora era muy fácil de leer en la tableta.

Consejo: En el contenido del archivo por lotes mencionado anteriormente, básicamente ejecuto un FORbucle y tomo cada archivo PDF y lo paso a Briss para recortar automáticamente el PDF. Dependiendo de

  1. donde está instalado el Briss (y la arquitectura de la computadora, es decir, x86 o x64).
  2. donde está instalado el Java Run Time Environment.
  3. El entorno de tiempo de ejecución de Java se puede descargar gratis desde aquí
Narayanan
fuente
1

Leer archivos PDF en un Kindle no es ideal. Una forma ideal es convertir los archivos PDF a un formato que el Kindle reconocerá utilizando MobiCreator para convertir archivos PDF en archivos .prc para el Kindle de Amazon.

1. Descargue e instale la versión COMPLETA de Mobipocket Creator desde el siguiente enlace. (Si opta por la versión más simple, no tendrá la opción de conversión de PDF).

http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN

2. Cuando se está ejecutando Mobipocket Creator, seleccione Adobe PDF en Importar desde archivo existente

3. Elija el archivo PDF que desea convertir

4. Deje el resto solo a menos que desee cambiar su carpeta de destino y haga clic en Importar

5. Seleccione el archivo html que acaba de crear y haga clic en Crear en la barra de herramientas en la parte superior de Mobipocket Creator

6. Haz clic en Build (lo más probable es que obtengas algunos errores, pero los ignoro)

7. Vaya a su carpeta de destino, abra la carpeta que se creó con su publicación

8. Copie el archivo .prc en la carpeta Documentos de su Kindle a través del cable USB (si desea que se entregue de forma inalámbrica, deberá enviarse un correo electrónico y pagar 10 centavos)

Una de las principales dificultades para leer archivos PDF en el Kindle es la falta de una tabla de contenido, por lo que no puede saltarse fácilmente.

Sin embargo, hay una función en Mobipocket Creator para crear una tabla de contenido.

Simon
fuente
El dispositivo es en realidad un Kindle DX; que no tiene incorporado un lector de PDF, y es suficientemente de gran formato que mis documentos están muy bien con sus márgenes recortados.
Charles Duffy
@CharlesDuffy Bien, menos molestias entonces. Gracias por informarme, esperaba que funcionara
Simon