Crear pdf desde libro HTML

16

Hay algunos sitios que proporcionan libros como páginas HTML (por ejemplo, material legal).

¿Qué puedo usar para crear un libro PDF a partir de estas páginas, en función de la estructura ya existente?

En Windows hay Adobe Professional (software comercial). ¿Supongo que Linux tiene algo gratis? Una solución que implica scripting estaría bien para mí.

Lucian Sasu
fuente

Respuestas:

9

Calibre es una herramienta bastante poderosa para convertir cosas en libros electrónicos en varios formatos. ¡Disponible en un centro de software cerca de usted!

No se deje engañar por su interfaz de usuario menos que hermosa, puede hacer mucho.

Oli
fuente
1
calibre también viene con una herramienta de línea de comandos, ebook-convert. Entonces con eso podrías hacer for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; doney convertiría todos los archivos html de la carpeta a PDF.
frabjous
1
Esta es una buena herramienta, también soy un usuario de Calibre, creo que la última ha marcado mejoras en la interfaz de usuario.
Sabacon el
4

¿La forma más fácil? Archivo> Imprimir desde su navegador. Seleccione Imprimir en archivo como su impresora, y le preguntará dónde lo quiere. Asegúrese de marcar el PDF. Presiona "Imprimir" y se guardará en tu disco en lugar de imprimir.

Jacob Peddicord
fuente
Gracias. Sin embargo, hay muchos archivos. Esta maniobra es prácticamente imposible.
Lucian Sasu
4

Htmldoc puede ser útil, verlo aquí; http://www.htmldoc.org/ está disponible en el centro de software, lamentablemente la versión 1.8 tiene un problema con los archivos codificados Unicode, pero en muchas ocasiones aún puede ser un salvador, el problema se solucionó en la versión de desarrollo 1.9.

Usualmente uso la maravillosa extensión del álbum de recortes aquí; http://amb.vis.ne.jp/mozilla/scrapbook/ para que Firefox capture las páginas web, use las herramientas de edición en el bloc de notas para arreglarlas si es necesario y luego use htmldoc para convertir todas las páginas a PDF.

Sabacon
fuente
3

Recomendaría usar OpenOffice / LibreOffice para crear el PDF. Como prueba, descargué el manual de Wget (todo en una página) y luego abrí la página HTML en OponOffice e hice clic en el botón "Exportar directamente a PDF". Creó el PDF con un índice de la tabla de contenido.

En el pasado, he encontrado que esta es la forma más fácil de convertir páginas HTML a PDF. También le permite realizar cambios sin mucho esfuerzo.

Capturas de pantalla

  • Manual de Wget exportado a PDF usando Open Office Manual de Wget exportado a PDF usando Open Office

  • Opción Exportar directamente a PDF en Open Office Opción Exportar directamente a PDF en Open Office

SiliconChaos
fuente
¿Alguna idea si el libro no está en una página, sino dividido en múltiples capítulos / secciones?
Ciprian Tomoiagă
2

De hecho, he votado por la solución de calibre. Pero aquí hay otro que podrías probar. Instala AbiWord . Puede realizar conversiones entre cualquier formato que conozca desde la línea de comandos. Para convertir todos los archivos .html de una carpeta a .pdf, puede hacer lo siguiente:

for file in *.html ; do abiword --to=pdf "$file" ; done

Para la tipografía de nivel superior (pero posiblemente más complicada), otra opción sería PrinceXML .

precioso
fuente
2

Dependiendo del documento html a imprimir, puede obtener los mejores resultados con pandoc . Este es uno de los convertidores de HTML a LaTeX más versátiles. El archivo .tex resultante se puede convertir a PDF con bastante facilidad, usando xelatexo pdflatex. Hay muchas opciones disponibles si está dispuesto a profundizar en la sintaxis y los paquetes de LaTeX. Esto puede no funcionar bien si se deben preservar las imágenes incrustadas y los estilos HTML sofisticados.

loevborg
fuente
1

En google-chrome, puede crear un archivo pdf para un sitio completo utilizando una extensión. Personalmente utilizo la extensión Web2PDF Converter que crea un PDF con solo un clic.

Aquí hay una captura de pantalla de este complemento, proporcionada por el sitio de la tienda web de extensiones de Google.

ingrese la descripción de la imagen aquí

Además, puede ver un PDF creado por mí con esta herramienta, descargando el siguiente (clic derecho, guardar destino como): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (algunos navegadores como google- Chrome puede permitirle ver esto en línea).

Y si desea editar esos PDF creados por la extensión para eliminar la firma digital colocada por la extensión en la parte inferior de cada página o eliminar cualquier otra cosa, eche un vistazo a esto: ¿ Eliminar información de texto de un PDF?

¡Buena suerte!

Geppettvs D'Constanzo
fuente