Descargador de sitios web (¿caché?) Para ver sitios sin conexión

9

¿Hay alguna forma portátil de descargar o almacenar en caché todas las páginas de un sitio web para verlas sin conexión? Mañana tengo un vuelo a campo traviesa y me gustaría poder almacenar en caché algunas páginas web (particularmente la página de documentación de Python ( http://docs.python.org/ ) y la referencia de pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealmente, me gustaría un complemento de Firefox o algo así, pero cualquier cosa funcionará bien siempre que pueda ejecutarlo en Linux.

Falmarri
fuente
Puedes probar este descargador de sitios web sin conexión .
Menelaos Vergis

Respuestas:

15

Yo uso HTTrack .

Le permite descargar un sitio de la World Wide Web de Internet a un directorio local, creando recursivamente todos los directorios, obteniendo HTML, imágenes y otros archivos del servidor a su computadora

Edgar
fuente
He usado este en el pasado, una buena solución gratuita.
MaQleod
1
HTTrack es lo mejor para Linux y Windows y hay una enorme lista de opciones para configurar el proceso de descarga .. Me encanta
eslambasha
Yo también lo usé; ahora también ofrecen una versión de Android.
gparyani
-1 No crea "todos los directorios", no obtiene todas las "imágenes y otros archivos". Solo obtiene lo que está vinculado.
barlop
6

Uso wget con estas opciones para reflejar un sitio para uso sin conexión

wget -cmkE -np http://example.com/a/section/i/like

dónde

-m activa las opciones de duplicación para duplicar un sitio localmente

-c continúa una descarga anterior en caso de que ya haya descargado algunas páginas

-k convierte href absoluto para que apunte a los locales para verlos sin conexión

-E garantiza que los archivos tengan la extensión .html después de la descarga.

-np solo descarga objetos en / a / section / i / y no almacena en caché todo el sitio.

Por ejemplo, quería descargar la documentación del sur pero no los boletos del sur, etc.

wget -cmkE -np http://south.aeracode.org/docs/index.html

Uso Windows y ejecuto wget en cygwin, pero también hay un puerto wget nativo de Windows .

Aunque, en su caso, puede descargar documentos sin conexión de Python desde la sección de documentos de Python

Meitham
fuente
1

Pruebe http://www.downthemall.net/ un complemento de Firefox. Lo he usado para descargar 250 páginas de archivos PDF en más de 20 archivos separados. Es extremadamente poderoso. Tiene una sintaxis comodín / consulta que le permite obtener quirúrgicamente solo los archivos que desea y ninguno de los irrelevantes que no tiene.

Rolnik
fuente
1

Algunas extensiones de Firefox que conozco:

  • Álbum de recortes

    le ayuda a guardar páginas web y administrar colecciones fácilmente. Las características clave son ligereza, velocidad, precisión y soporte multilingüe. Las características principales son:

    • Guardar página web
    • Guardar fragmento de página web
    • Guardar sitio web
    • Organice la colección de la misma manera que los Marcadores.
    • Búsqueda de texto completo y búsqueda de filtrado rápido de la colección.
    • Edición de la página web recopilada
    • Característica de edición de texto / HTML similar a las Notas de Opera
  • ScrapBook Plus

    Diferencia entre ScrapBook Plus y ScrapBook:

    • clasificación más rápida
    • importación y exportación más rápidas
    • abra la ventana para administrar su colección directamente desde la barra lateral
    • simplificó el manejo del "Asistente de combinación"
    • Nuevas funciones para "Capturar múltiples URL" (filtro para excluir enlaces, usar el título del sitio web o título del enlace como nuevo título para la entrada en la barra lateral, especificar el tiempo de espera entre la descarga de 0 a 3 segundos, usar UTF-8 o ISO-8859-1 como juego de caracteres)
    • nueva ventana "Captura" (la descarga debe iniciarse manualmente, el desplazamiento automático desactivado)
    • 6 marcadores en el editor
  • UNMHT

    le permite ver archivos de formato de archivo web MHT (MHTML) y guardar páginas web completas, incluidos texto y gráficos, en un solo archivo MHT

  • Pocket (no es una extensión; una función incorporada de Firefox)

    le permite guardar páginas web y videos en Pocket con solo un clic. Pocket elimina el desorden y guarda la página en una vista limpia, sin distracciones y le permite acceder a ellos mientras viaja a través de la aplicación Pocket.

    Tenga en cuenta que:

    Guardar y acceder a su lista de Pocket en Firefox requiere una conexión a Internet. La visualización sin conexión es posible en otros dispositivos con la aplicación Pocket.

galacticninja
fuente
0

Puede descargar un sitio web completo o parte de un sitio web con wget.

wget -r http://docs.python.org/

Consulte el manual de wget para ver otras opciones que desee pasar, por ejemplo, para limitar su uso de ancho de banda, para controlar la profundidad de recursión, para configurar listas de exclusión, etc.

Otro enfoque para la navegación fuera de línea es usar un proxy de almacenamiento en caché. Wwwoffle es uno que tiene muchas características para facilitar la retención para la navegación fuera de línea, como anulaciones de las fechas de vencimiento especificadas por el servidor y una capacidad de recuperación previa recursiva. (He estado usando wwwoffle desde mis días de acceso telefónico).

Gilles 'SO- deja de ser malvado'
fuente