En Linux, ¿cómo puedo obtener una URL y obtener su contenido en una variable en un script de shell?
115
Puede usar el wgetcomando para descargar la página y leerla en una variable como:
content=$(wget google.com -q -O -)
echo $content
Usamos la -Oopción de wgetque nos permite especificar el nombre del archivo en el que wgetvolca el contenido de la página. Especificamos -obtener el volcado en la salida estándar y recopilarlo en la variable content. Puede agregar la -qopción silenciosa para desactivar la salida wget.
Puede usar el comando curl para esto, así como:
content=$(curl -L google.com)
echo $content
Necesitamos usar la -Lopción ya que la página que estamos solicitando podría haberse movido. En cuyo caso, necesitamos obtener la página de la nueva ubicación. La opción -Lo --locationnos ayuda con esto.
srcatributo del elemento correcto y luego descargar esa página. Si instala tq , este comando debería hacerlo:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wgetconvert_links = oncon la-O-opción. Está fallando por error-k can be used together with -O only if outputting to a regular file.. ¿Es esperado?Hay muchas formas de obtener una página desde la línea de comandos ... pero también depende de si desea la fuente del código o la página en sí:
Si necesita el código fuente:
con rizo:
con wget:
pero si desea obtener lo que puede ver con un navegador, lynx puede ser útil:
Creo que puede encontrar tantas soluciones para este pequeño problema, tal vez debería leer todas las páginas de manual de esos comandos. Y no olvides reemplazar
$urlpor tu URL :)Buena suerte :)
fuente
Existe el
wgetcomando o elcurl.Ahora puede usar el archivo que descargó con wget. O puede manejar una corriente con rizo.
Recursos:
fuente
fuente
Si tiene LWP instalado, proporciona un binario simplemente llamado " GET ".
wget -O-,curly selynx -sourcecomportan de manera similar.fuente
Puede usar
curlowgetpara recuperar los datos sin procesar, o puede usarw3m -dumppara tener una buena representación de texto de una página web.fuente