¿No puede descargar el sitio web para verlo sin conexión en Ubuntu?

0

Con la referencia de esto , intenté descargar todo el sitio web tutorial desde https://www.guru99.com/, así que intenté ejecutar los siguientes comandos sin ningún éxito

wget -r --mirror -p --convert-links -P . https://www.guru99.com

wget -r https://www.guru99.com

wget -r -l 0 https://www.guru99.com

El regreso de la consola del terminal es el siguiente

--2019-04-17 08:33:48--  https://www.guru99.com/
Resolving www.guru99.com (www.guru99.com)... 72.52.251.71
Connecting to www.guru99.com (www.guru99.com)|72.52.251.71|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.guru99.com/index.html’

www.guru99.com/index.html                [  <=>                                                                 ]  13.31K  43.4KB/s    in 0.3s    

2019-04-17 08:33:50 (43.4 KB/s) - ‘www.guru99.com/index.html’ saved [13633]

FINISHED --2019-04-17 08:33:50--
Total wall clock time: 1.7s
Downloaded: 1 files, 13K in 0.3s (43.4 KB/s)

Y el archivo descargado solo tiene index.html. ¿Cuál es el problema con eso? ¿Cómo puedo descargar este sitio web sin conexión? Gracias.

Houy Narun
fuente

Respuestas:

1

El programa "httrack" hará exactamente lo que estás buscando. Para obtener más información, vaya a Ubuntu httrack.

Instale con: sudo apt install httracke inícielo ingresando httracken su terminal.

Para ese sitio en particular, tomará mucho tiempo y no muestra ninguna indicación de progreso. Se paciente ;)

bashBedlam
fuente
0

Puedes intentar hacer esto de la siguiente manera:

wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains guru99.com \
     --no-parent \
     www.guru99.com/index.html

Referencia: https://www.linuxjournal.com/content/downloading-entire-web-site-wget

no adecuado001
fuente
gracias, todavía no funciona
Houy Narun