Quiero escribir un código para dar los nombres de los personajes en series de televisión o películas usando un script de shell ... Planeo hacerlo al extraer la fuente de la página del resultado de búsqueda de google para el cual requeriré la página fuente de los enlaces ... por ejemplo, este enlace probé directamente usando wget pero da el código de error 8 y también curl -L alimenta la fuente de la página "incorrecta"
shell-script
wget
curl
juggernauthk108
fuente
fuente
wget
ycurl
no hagas ningún procesamiento.Respuestas:
Si observa los mensajes de registro de wget, verá que finalmente obtiene "403 Prohibido" de Google.
Así que siéntase invitado a ver esta respuesta de Stackoverflow . Google no quiere que su página de resultados de búsqueda se use de manera automatizada, y supongo que tienen buenas razones.
Si quiere hacer esto de todos modos, puede configurar otra cadena de Agente de usuario con
wget --user-agent=Chrome -O results.html 'https://www.google.com/search?hl=en&q=iron%20man%20character%20names'
Sin embargo, la respuesta que obtiene de Google no es fácil de analizar, ¿tal vez pueda usar una base de datos de películas para esta tarea?
fuente