Solo uso wget todas las noches. FWIW, aquí están los parámetros que uso:
-N - activa la marca de tiempo
-r - recursivo
-k - convertir enlaces
-nv - Desactiva el registro detallado
-o - registro de salida
-i: archivo de entrada de sitios para rastrear
-m - espejo
-w1: espera 1 segundo entre solicitudes
--random-wait - usa tiempos de espera aleatorios entre solicitudes
-np: sin padre, nunca asciende al directorio padre
-p: descarga todos los requisitos previos de la página (hojas de estilo, scripts, etc.)
-X - directorios para excluir
-R - nombres de archivo para rechazar
-H - hosts de expansión (limitado por -D)
-D: dominios para rastrear (limitado a estos dominios)
El mayor problema es que la mayoría de las páginas que devuelve Blogger no tienen un encabezado HTTP de última modificación en la respuesta, por lo que vuelve a descargar archivos sin cambios y registra el siguiente mensaje:
"Falta el encabezado de la última modificación: las marcas de tiempo están desactivadas".
Si pudiera descubrir cómo silenciar ese comportamiento, estaría feliz, porque eso es lo que lo hace lento y también mi copia de seguridad local tiene que lidiar con esos archivos todas las noches porque cree que han cambiado (cuando no lo han hecho).