Tengo un libro electrónico que intento leer en formato PDF en un Kindle. Desafortunadamente, los encabezados y pies de página tienen cierto contenido (número de página e información de derechos de autor, respectivamente) que impiden que el dispositivo escale el texto real para que coincida con el área de visualización del área utilizable, lo que deja el contenido real demasiado pequeño para leer.
Hay varias herramientas disponibles que recortarán los espacios en blanco, pero el Kindle ya lo hace; mi objetivo, por el contrario, es eliminar el material impreso fuera de un cuadro delimitador definido, y la única herramienta que he encontrado para este propósito es un software comercial moderadamente caro.
Probablemente podría generar una máscara en Inkscape; divida las páginas individuales usando pdftk, aplique la máscara a cada página individualmente (salida a postscript), y recombine los numerosos archivos postscript en un solo PDF. Sin embargo, estos pasos de decodificación / recodificación serían bastante desafortunados en términos de tamaño del documento; algo capaz de funcionar con un poco más de delicadeza sería ideal.
Tengo a mano todos los principales sistemas operativos (Windows, varias distribuciones modernas de Linux, una Mac, etc.) por lo que las soluciones no necesitan estar limitadas por la plataforma.
Sugerencias?
(He informado el problema al autor, quien lo mencionó a su editor, que no ha hecho nada sobre el tema en el transcurso de más de un mes, lo que hace que el enfoque de trabajo cero sea evidentemente improductivo).
Como se mencionó en otra respuesta, BRISS es genial. Otra herramienta realmente útil es k2pdfopt ( http://www.willus.com/k2pdfopt/ ). Esta herramienta es realmente genial para tomar un pdf y optimizarlo para el Kindle (o cualquier dispositivo con pantalla más pequeña). Funciona muy bien para el papel científico de 2 columnas, ya que refluye el texto manteniendo la ecuación y las imágenes.
fuente
Como ya se señaló, k2pdfopt es una gran herramienta.
Si no le importa romper su Kindle (y posiblemente anular su garantía) también existe la opción de usar esta herramienta directamente en su lector. Esto se implementa mediante tres tenedores del mismo paquete de software:
Se ocupan de múltiples columnas, permiten el reflujo de texto y el cambio del tamaño de fuente. Incluso logran no destruir fórmulas e imágenes científicas al refluir.
En este momento hay problemas menores como espacios faltantes entre dos palabras de un salto de línea, pero las considero sin problemas. Tal vez se arreglen en una de las próximas versiones.
fuente
Puede usar ScanTailor para una herramienta más poderosa. Esta herramienta no solo recorta automáticamente los márgenes, sino que también puede agregar más (en caso de que alguien llegue a esta pregunta para la última). A continuación se muestra el contenido de su página wiki Diseño de página :
En esta etapa, puede ajustar los márgenes agregados al cuadro de contenido. Hay dos tipos de márgenes: duro y blando.
Margen duro: es el que se encuentra entre las líneas continuas. Son establecidos por el usuario. Puede moverse sobre cualquier línea continua, ya sea un borde interno o externo, o establecer los márgenes a través de valores numéricos.
Margen suave: es el que se encuentra entre la línea continua y la línea de puntos. Estos márgenes se agregan automáticamente para llevar el tamaño de la página al mismo tamaño que otras páginas. Si ve una línea punteada, esto significa que en algún lugar del proyecto hay una página con ese ancho (área utilizable de margen duro + margen) y (posiblemente otros) con esa altura.
Esta es una página grande que causa márgenes suaves en todas las otras páginas, aunque solo sea por no nivelarlas.
La alineación opcional se define con precisión, agregue un margen suave y, si agrega, con cualquiera de las partes.
fuente
También tuve este problema con mi PDF escaneado (no inglés) de 1200 páginas. Todas las herramientas, incluido Adobe Acrobat (IX a XI) no pudieron recortar el espacio en blanco circundante. El margen de la página impar difiere del de las páginas pares. Para empeorar esto, el tamaño del margen era inconsistente. Como señaló @frabjous , Briss ayudó. Sin embargo, cuando se superpusieron todas las páginas del documento, se observó que no se puede aplicar un recorte ya que no había ningún espacio en blanco efectivo en general (debido a márgenes inconsistentes)
La única solución era dividir el documento PDF en páginas individuales, ejecutarlo en Briss para eliminar márgenes y recombinar. Los pasos que seguí son:
Document->Split document
que abrió el siguiente cuadro de diálogo: Esta acción creó 1200 archivos PDF individuales.for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
Consejo: En el contenido del archivo por lotes mencionado anteriormente, básicamente ejecuto un
FOR
bucle y tomo cada archivo PDF y lo paso a Briss para recortar automáticamente el PDF. Dependiendo defuente
Leer archivos PDF en un Kindle no es ideal. Una forma ideal es convertir los archivos PDF a un formato que el Kindle reconocerá utilizando MobiCreator para convertir archivos PDF en archivos .prc para el Kindle de Amazon.
1. Descargue e instale la versión COMPLETA de Mobipocket Creator desde el siguiente enlace. (Si opta por la versión más simple, no tendrá la opción de conversión de PDF).
http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN
2. Cuando se está ejecutando Mobipocket Creator, seleccione Adobe PDF en Importar desde archivo existente
3. Elija el archivo PDF que desea convertir
4. Deje el resto solo a menos que desee cambiar su carpeta de destino y haga clic en Importar
5. Seleccione el archivo html que acaba de crear y haga clic en Crear en la barra de herramientas en la parte superior de Mobipocket Creator
6. Haz clic en Build (lo más probable es que obtengas algunos errores, pero los ignoro)
7. Vaya a su carpeta de destino, abra la carpeta que se creó con su publicación
8. Copie el archivo .prc en la carpeta Documentos de su Kindle a través del cable USB (si desea que se entregue de forma inalámbrica, deberá enviarse un correo electrónico y pagar 10 centavos)
Una de las principales dificultades para leer archivos PDF en el Kindle es la falta de una tabla de contenido, por lo que no puede saltarse fácilmente.
Sin embargo, hay una función en Mobipocket Creator para crear una tabla de contenido.
fuente