En Linux, ¿cómo puedo obtener una URL y obtener su contenido en una variable en un script de shell?
115
Puede usar el wget
comando para descargar la página y leerla en una variable como:
content=$(wget google.com -q -O -)
echo $content
Usamos la -O
opción de wget
que nos permite especificar el nombre del archivo en el que wget
volca el contenido de la página. Especificamos -
obtener el volcado en la salida estándar y recopilarlo en la variable content
. Puede agregar la -q
opción silenciosa para desactivar la salida wget.
Puede usar el comando curl para esto, así como:
content=$(curl -L google.com)
echo $content
Necesitamos usar la -L
opción ya que la página que estamos solicitando podría haberse movido. En cuyo caso, necesitamos obtener la página de la nueva ubicación. La opción -L
o --location
nos ayuda con esto.
src
atributo del elemento correcto y luego descargar esa página. Si instala tq , este comando debería hacerlo:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wget
convert_links = on
con la-O-
opción. Está fallando por error-k can be used together with -O only if outputting to a regular file.
. ¿Es esperado?Hay muchas formas de obtener una página desde la línea de comandos ... pero también depende de si desea la fuente del código o la página en sí:
Si necesita el código fuente:
con rizo:
con wget:
pero si desea obtener lo que puede ver con un navegador, lynx puede ser útil:
Creo que puede encontrar tantas soluciones para este pequeño problema, tal vez debería leer todas las páginas de manual de esos comandos. Y no olvides reemplazar
$url
por tu URL :)Buena suerte :)
fuente
Existe el
wget
comando o elcurl
.Ahora puede usar el archivo que descargó con wget. O puede manejar una corriente con rizo.
Recursos:
fuente
fuente
Si tiene LWP instalado, proporciona un binario simplemente llamado " GET ".
wget -O-
,curl
y selynx -source
comportan de manera similar.fuente
Puede usar
curl
owget
para recuperar los datos sin procesar, o puede usarw3m -dump
para tener una buena representación de texto de una página web.fuente