"Imprimir" página web a PDF con hipervínculos de trabajo

11

Imprimo muchas páginas web en pdf, usando CutePDF. Las URL se mantienen como enlaces activos en el documento pdf, pero los hipervínculos no generan un enlace activo.

¿Existe alguna impresora pdf, preferiblemente gratuita, que mantenga hipervínculos activos al imprimir páginas web?

(Y por favor, no aconseje ninguna herramienta que no lo haga específicamente)

Yo uso Firefox, pero no creo que el navegador deba importar.

Bretddog
fuente
No estoy seguro de qué quiere decir exactamente con hipervínculos enmascarados. Según la definición conocida de hipervínculo enmascarado, no debería importar una impresora pdf. De hecho, la impresora PDF no tiene forma de saber a dónde conduce el hipervínculo, por lo que no distingue entre enlaces enmascarados y no enmascarados.
Art Gertner
smc; Simplemente me refiero al texto normal que tiene un hipervínculo, como; superusuario Si enmascarado es incorrecto, ¿cuál es el término para esto?
Bretddog
El término es hipervínculo . No tiene nada que ver con el enmascaramiento. El texto sin formato se llama URL . El hipervínculo es un objeto en el que se puede hacer clic que te lleva a la URL . Lea wiki: Hyperlink y wiki: URL . Además, no olvide actualizar su pregunta (incluido el título)
Art Gertner

Respuestas:

4

Primero tengo que asegurarle que importa qué navegador está utilizando. A menos que esté utilizando el cuadro de diálogo de impresión estándar del sistema operativo, el navegador utilizará su propia biblioteca para crear el PDF. Los resultados variarán entre los diferentes navegadores.

Como experimento, imprimí esta página usando Firefox y Chromium. Firefox no guardó ningún enlace en el que se pueda hacer clic. El cromo ahorró alrededor del 50% y la selección parecía ser bastante aleatoria.

Creo que la mejor solución para usted sería instalar un complemento / extensión de navegador que haga el trabajo.

Hice una búsqueda rápida y para Firefox encontré esta: las páginas Imprimir en PDF sin imaginación . Enlace directo a la última versión: 0.5.0.6 .

Crea un Pdf a partir de cualquier cantidad de páginas abiertas de Browsertabs, Bookmarks / -folder, Scrapbook (Plus). Este documento puede archivarse, enviarse [sic] por correo electrónico o imprimirse con cualquier visor de PDF estándar.

Si revisa la lista de características, encontrará lo que está buscando:

  • Retiene enlaces en el pdf del contenido de las páginas web
  • Admite enlaces locales para navegar en la página web / pdf

Lo probé brevemente e imprimió la página correctamente con todos los enlaces en los que se puede hacer clic.

Art Gertner
fuente
Bueno, esto se ve bastante impresionante! :) Hasta ahora buenos resultados y algunas buenas opciones. ¡Gracias!
bretddog
1
Estos enlaces están muertos.
AllInOne
1
@AllInOne, actualizado
Art Gertner
@ArtGertner Los enlaces a cualquier versión de esto están muertos. (Me encantó el complemento antes ...)
Malaquías
5

Usar la impresora virtual integrada "guardar como PDF" de Chrome es otra opción. Funcionó para mí donde la extensión "imprimir páginas a PDF" de Firefox estropeó la página (pero de hecho conservó los hipervínculos)

hetchel
fuente
Los documentos del W3C como w3.org/TR/xmlschema11-1/#composition-schemaImport no parecen funcionar con ese enfoque: el documento vinculado NO se puede buscar y los enlaces NO funcionan.
koppor
Acabo de probar esa página, con la última versión de Chrome. El documento se puede buscar y los enlaces externos sí funcionan. Enlaces internos (a un ancla en la página), NO funcionan (lo cual es un gran problema para este tipo de documento). El uso de "Imprimir páginas a PDF" parece dar un mejor resultado con esa página: búsqueda, y con enlaces externos Y internos funcionando, y parece preservar el diseño correctamente.
hetchel
3

wkhtmltopdf

Basado en Imprimir páginas a PDF , sugiero la herramienta independiente wkhtmltopdf .

"c:\Program Files\wkhtmltopdf\bin\wkhtmltopdf" "http://www.example.com" test.pdf

Pandoc

wkhtmltopdf no funcionó en mi caso , por lo tanto, recomiendo Pandoc . Es un poco más complicado hacerlo funcionar. Con documentos pequeños, debería poder ejecutar

pandoc http://www.example.org/ -o test.pdf

Cuando tiene documentos UTF-8 con caracteres chinos, debe hacerlo de la siguiente manera:

pandoc http://blog.fefe.de/ -o test.tex
lualatex test.tex
lualatex test.tex

trabajo en progreso

Sin embargo, en mi configuración concreta pandoc http://www.w3.org/TR/DOM-Parsing/ -o test.pdf, condujo a un error de LaTeX.

! LaTeX Error: Too deeply nested.

Por lo tanto, creé el archivo de látex manualmente:

pandoc http://www.w3.org/TR/DOM-Parsing/ --standalone -o test.tex

Luego, tuve que deshabilitar la línea 78, porque \includegraphicsestaba dentro \href.

Con un truco sugerido en stackoverflow (insertado en la línea 74, justo antes \begin{document}), tampoco pude ejecutarlo ( pdflatex test).

Abrí el número 2438 en Pandoc.

koppor
fuente
2

El complemento Imprimir páginas a PDF ya no está disponible en Firefox. Probé la alternativa que figura en este y otros hilos, pero no tuve suerte.

¿Qué funciona?

  • Use la barra de herramientas Adobe PDF para Internet Explorer.
  • Use la función "Convertir página web a PDF" en la barra de herramientas.
Erik T. Wiik
fuente
A partir del 07/10/2015, Imprimir páginas en PDF todavía está disponible: ver printpdf.pf-control.de/index.php/en/0.5.0.2.html
koppor
Gracias por tu comentario. Verifiqué el sitio que vinculaste y seguí las instrucciones sobre cómo instalar ( printpdf.pf-control.de/index.php/en/installation.html ) Esa página enlaza con addons.mozilla.org/en-US/firefox/addon/ print-pages-to-pdf donde dice "Este complemento ha sido eliminado por su autor".
Erik T. Wiik
Siga el enlace que figura en el primer párrafo de mi enlace. El texto dice "Si desea descargar esta versión, puede hacerlo a través de este enlace. (Si ya descargó 0.5.0.1, esta es idéntica)". "Este enlace" enlaza con printpdf.pf-control.de/versions/0.5.0.2/xpi/…
koppor
1

Hay un complemento FireFox "save-as-pdf", que guarda los hipervínculos en el documento PDF: https://addons.mozilla.org/en-US/firefox/addon/save-as-pdf/

(es gratis, pero desarrollado por una empresa comercial http://pdfcrowd.com )

Noam Manos
fuente
Vale la pena mencionar que esta conversión se realiza en línea. El complemento envía la URL al servicio en línea de pdfcrowd que lo convierte y devuelve el PDF. No utilizaré ese complemento debido a problemas de privacidad. No quiero saber pdfcrowd en qué sitios me interesan. Además, esté preparado para todo tipo de filtraciones de datos confidenciales cuando use ese servicio (contenido confidencial de la página en pregunta, identificadores de sesión codificados en la URL y así sucesivamente), y para el complemento no funciona si los datos de inicio de sesión / identificador de sesión se proporcionan al sitio web en cuestión a través de solicitudes posteriores.
Binarus