Solo una breve y simple sobre el excelente módulo de Solicitudes para Python.
Parece que no puedo encontrar en la documentación qué debería contener la variable 'proxies'. Cuando le envié un dict con un valor estándar de "IP: PUERTO" lo rechazó pidiendo 2 valores. Entonces, supongo (porque esto no parece estar cubierto en los documentos) que el primer valor es la ip y el segundo el puerto.
Los documentos solo mencionan esto:
proxies: (opcional) Protocolo de asignación de diccionario a la URL del proxy.
Así que intenté esto ... ¿qué debería hacer?
proxy = { ip: port}
¿y debo convertirlos a algún tipo antes de ponerlos en el dict?
r = requests.get(url,headers=headers,proxies=proxy)
fuente
urllib3
así que tendré que investigar eso. Gracias por el aviso.He descubierto que urllib tiene un código realmente bueno para recoger la configuración de proxy del sistema y están en la forma correcta para usar directamente. Puedes usar esto como:
Funciona muy bien y urllib también sabe cómo obtener la configuración de Mac OS X y Windows.
fuente
module 'urllib' has no attribute 'getproxies'
Puede consultar la documentación del proxy aquí .
Si necesita usar un proxy, puede configurar solicitudes individuales con el argumento proxies para cualquier método de solicitud:
Para usar HTTP Basic Auth con su proxy, use la sintaxis http: // user: [email protected]/ :
fuente
La respuesta aceptada fue un buen comienzo para mí, pero seguía recibiendo el siguiente error:
La solución a esto fue especificar http: // en la URL del proxy de esta manera:
Me interesaría saber por qué el original funciona para algunas personas, pero no para mí.
Editar: veo que la respuesta principal ahora se actualiza para reflejar esto :)
fuente
Si desea conservar las cookies y los datos de sesión, es mejor que lo haga así:
fuente
8 años de retraso. Pero me gusta:
fuente
¡Aquí está mi clase básica en Python para el módulo de solicitudes con algunas configuraciones proxy y cronómetro!
fuente
Acabo de hacer un proxy graber y también puedo conectarme con el mismo proxy capturado sin ninguna entrada aquí es:
fuente
Es un poco tarde, pero aquí hay una clase de contenedor que simplifica el proxy de raspado y luego hace un HTTP POST o GET:
Solicitudes de proxy
fuente
Comparto algunos códigos sobre cómo obtener proxies del sitio "https://free-proxy-list.net" y almacenar datos en un archivo compatible con herramientas como "Elite Proxy Switcher" (formato IP: PUERTO):
## PROXY_UPDATER - obtén proxies gratis de https://free-proxy-list.net/
fuente