HTML recursivo a PDF

12

Tengo una carpeta con esta estructura:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

con muchas subcarpetas y solo archivos html ... quiero convertirlos a pdf usando solo un comando o un script simple que no requiera todos los nombres de archivo.

Conoces uno

Matteo Pagliazzi
fuente

Respuestas:

15

Sugeriría instalar la herramienta WKHtmlToPDF desde http://wkhtmltopdf.org/ (movido de: http://code.google.com/p/wkhtmltopdf/ ).

Luego puede cambiar a la carpeta raíz y usar find y xargs para convertirlos:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Esto generará un PDF con cada archivo HTML.

dan_linder
fuente
Lo resolví con una lista de archivos y un bash, ¡pero esto es mucho mejor!
Matteo Pagliazzi
5

El siguiente comando debería hacer el trabajo para un enlace:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Para enlaces múltiples, no debería ser difícil escribir un bucle que maneje cada enlace uno por uno.

jcollado
fuente