Hay algunos sitios que proporcionan libros como páginas HTML (por ejemplo, material legal).
¿Qué puedo usar para crear un libro PDF a partir de estas páginas, en función de la estructura ya existente?
En Windows hay Adobe Professional (software comercial). ¿Supongo que Linux tiene algo gratis? Una solución que implica scripting estaría bien para mí.
software-recommendation
pdf
html
Lucian Sasu
fuente
fuente
for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; done
y convertiría todos los archivos html de la carpeta a PDF.¿La forma más fácil? Archivo> Imprimir desde su navegador. Seleccione Imprimir en archivo como su impresora, y le preguntará dónde lo quiere. Asegúrese de marcar el PDF. Presiona "Imprimir" y se guardará en tu disco en lugar de imprimir.
fuente
Htmldoc puede ser útil, verlo aquí; http://www.htmldoc.org/ está disponible en el centro de software, lamentablemente la versión 1.8 tiene un problema con los archivos codificados Unicode, pero en muchas ocasiones aún puede ser un salvador, el problema se solucionó en la versión de desarrollo 1.9.
Usualmente uso la maravillosa extensión del álbum de recortes aquí; http://amb.vis.ne.jp/mozilla/scrapbook/ para que Firefox capture las páginas web, use las herramientas de edición en el bloc de notas para arreglarlas si es necesario y luego use htmldoc para convertir todas las páginas a PDF.
fuente
Puede probar http://www.xhtml2pdf.com/ . Es un conversor de HTML / XHTML y CSS a PDF. Todo escrito en Python.
fuente
Recomendaría usar OpenOffice / LibreOffice para crear el PDF. Como prueba, descargué el manual de Wget (todo en una página) y luego abrí la página HTML en OponOffice e hice clic en el botón "Exportar directamente a PDF". Creó el PDF con un índice de la tabla de contenido.
En el pasado, he encontrado que esta es la forma más fácil de convertir páginas HTML a PDF. También le permite realizar cambios sin mucho esfuerzo.
Capturas de pantalla
Manual de Wget exportado a PDF usando Open Office
Opción Exportar directamente a PDF en Open Office
fuente
De hecho, he votado por la solución de calibre. Pero aquí hay otro que podrías probar. Instala AbiWord . Puede realizar conversiones entre cualquier formato que conozca desde la línea de comandos. Para convertir todos los archivos .html de una carpeta a .pdf, puede hacer lo siguiente:
for file in *.html ; do abiword --to=pdf "$file" ; done
Para la tipografía de nivel superior (pero posiblemente más complicada), otra opción sería PrinceXML .
fuente
Dependiendo del documento html a imprimir, puede obtener los mejores resultados con pandoc . Este es uno de los convertidores de HTML a LaTeX más versátiles. El archivo .tex resultante se puede convertir a PDF con bastante facilidad, usando
xelatex
opdflatex
. Hay muchas opciones disponibles si está dispuesto a profundizar en la sintaxis y los paquetes de LaTeX. Esto puede no funcionar bien si se deben preservar las imágenes incrustadas y los estilos HTML sofisticados.fuente
En google-chrome, puede crear un archivo pdf para un sitio completo utilizando una extensión. Personalmente utilizo la extensión Web2PDF Converter que crea un PDF con solo un clic.
Aquí hay una captura de pantalla de este complemento, proporcionada por el sitio de la tienda web de extensiones de Google.
Además, puede ver un PDF creado por mí con esta herramienta, descargando el siguiente (clic derecho, guardar destino como): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (algunos navegadores como google- Chrome puede permitirle ver esto en línea).
Y si desea editar esos PDF creados por la extensión para eliminar la firma digital colocada por la extensión en la parte inferior de cada página o eliminar cualquier otra cosa, eche un vistazo a esto: ¿ Eliminar información de texto de un PDF?
¡Buena suerte!
fuente