¿Alguien sabe cómo guardar una página web con scripts utilizando wget? ¿O qué parámetros hay que usar para lograr?
La página web contiene scripts y parece que solo la extensión SingleFile Core en Chrome puede guardar toda la propiedad de contenido. Firefox no puede guardar el contenido de la tabla y el guardado integrado de Chrome se bloqueará mostrando el mensaje 'por favor espere' para la página de resultados.
Las otras partes de la página no son importantes, solo lo es el contenido de la tabla, así que decido encontrar una manera de hacerlo, pero pasé una hora para analizar el código fuente y ver la información de las herramientas de desarrollo de f12, pero no puedo una manera de guardar solo el contenido de la tabla.
Aquí está la página web: http://m.marine.gov.mo/seawayScheduled/RealTimeSailing.aspx?type=dataDepartureXML&local=PE&lang=ENG
¡Gracias por la ayuda!
Respuestas:
Y la respuesta es:
Donde el bit 'ASP.NET ...' es una cookie que desafortunadamente es obligatoria. Esta cookie se envía cuando recupera la página principal. Entonces tienes que hacerlo un poco diferente con dos comandos:
uno que obtiene la página principal y la descarta (pero mantiene la cookie en cookie.txt):
uno que obtiene los datos, enviando la cookie:
Los datos que obtienes son una matriz JSON con dos elementos de cadena, que son HTML sin formato. Los caracteres especiales (comillas, corchetes ...) se escapan, por lo que el resultado no es muy legible como tal, pero no es difícil de limpiar con algunos cambios globales en un editor.
fuente