wget descargar archivos pdf fallan

1

Estoy usando:

wget -r -A pdf https://labraj.uni-mb.si

pero en lugar de pdf obtengo este resultado en la consola:

--2013-03-23 15:11:03--  https://labraj.uni-mb.si/
Resolving labraj.uni-mb.si (labraj.uni-mb.si)... 164.8.230.26
Connecting to labraj.uni-mb.si (labraj.uni-mb.si)|164.8.230.26|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://labraj.uni-mb.si/Splo%C5%A1ne_informacije [following]
--2013-03-23 15:11:09--  https://labraj.uni-mb.si/Splo%C5%A1ne_informacije
Reusing existing connection to labraj.uni-mb.si:443.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
labraj.uni-mb.si: Permission deniedlabraj.uni-mb.si/index.html: No such file or directory

Cannot write to `labraj.uni-mb.si/index.html' (Success).

¿Cómo puedo hacer esto correctamente?

Primož Kralj
fuente
¿Puedes correr mkdir labraj.uni-mb.siy ver qué pasa? Luego, intente lo mismo wget commandnuevamente.
slhck

Respuestas:

0

Puede usar este ejemplo, pero no creo que tome de las subcarpetas.

De http://www.thegeekstuff.com/2009/09/the-ultimate-wget-download-guide-with-15-awesome-examples/

14. Download Only Certain File Types Using wget -r -A

Puede usar esto en las siguientes situaciones:

Descargar todas las imágenes de un sitio web Descargar todos los videos de un sitio web Descargar todos los archivos PDF de un sitio web

$ wget -r -A.pdf http://url-to-webpage-with-pdfs/

También es posible que deba cambiar el agente del navegador para wgetque no aparezca como una araña.

Kobaltz
fuente
Esto es lo mismo que publiqué anteriormente. Si dejo de lado la -A.pdfparte, de lo contrario funciona.
Primož Kralj
¿Cuál es una URL de ejemplo de un archivo PDF ubicado en este sitio?
kobaltz
1
El OP es correcto, este comando debería funcionar pero no funciona. También probé lo que se sugirió aquí pero no tuve suerte. Funciona para archivos que no son pdf ( .pngpor ejemplo) pero falla específicamente para archivos PDF.
terdon