Estoy tratando de descargar una URL como esta http://www.somesite.com/restaurants.html#photo=22x00085
.
Lo puse entre comillas simples, pero solo descarga http://www.somesite.com/restaurants.html, que no es la página correcta.
¿Hay alguna solución?
Respuestas:
wget
está funcionando bien La sintaxis de URI especifica que el fragmento , la#foo
parte, se debe interpretar completamente del lado del cliente y no se debe usar al recuperar el documento.Por ejemplo, si se trata de una página HTML, el navegador puede desplazarse hacia abajo a una sección con nombre o, en su caso, activar algún código JavaScript que muestre una foto en particular.
En otras palabras, en lo que
wget
respecta, los URIhttp://www.somesite.com/restaurants.html#photo=22x00085
yhttp://www.somesite.com/restaurants.html
... apunta a la misma página
/restaurants.html
. Depende de su navegador hacer el resto. Abrirrestaurants.html#photo=22x00085
en el navegador debería funcionar bien.fuente
Sin visitar el enlace apropiado, no puedo decir cuál es, pero solo hay dos opciones:
El hash en realidad forma parte del nombre del documento solicitado. En este caso, puede codificarlo:
En el otro caso, en circunstancias normales, http://www.somesite.com/restaurants.html y http://www.somesite.com/restaurants.html#photo=22x00085 deben apuntar a la misma página. La parte después del hash simplemente indica el anclaje al que debe desplazarse el navegador después de cargar la página; Ni siquiera se envía al servidor.
Sin embargo, es posible que el hash (ab) se use para cargar una foto en particular con JavaScript. Wget no puede interpretar JavaScript, por lo que no hay nada que pueda hacer al respecto.
fuente
Esa no es la URL de la imagen. Es la URL de una página que usa un script u otro código para obtener la imagen. Intenta cargar la página con JavaScript desactivado. Eso es lo que wget está buscando para ti.
Para encontrar la URL de la imagen, intente visitar la página a través de su navegador y luego haga clic derecho en la foto. Debe haber una opción para ver información sobre la imagen, incluida su URL.
Si eso no funciona, puede ser porque la imagen se está cargando a través de Flash o algún otro programa del lado del cliente. Puede usar Fiddler o Wireshark para ver qué URL se está cargando.
Si nos proporciona la URL real del sitio con la imagen, podemos ayudarlo a determinar cómo se carga la imagen.
fuente