Cuando se utiliza wget
en un script para descargar algunos archivos de Google Docs, el nombre del archivo no se conserva. Por ejemplo:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
guarda el archivo como en pub?key=pyj6tScZqmEfbZyl0qjbiRQ
lugar de indicatorhivestimatedprevalence15-49.xls
, que es lo que obtengo si hago clic en el enlace en un navegador. ¿Hay alguna forma de hacer cumplir este comportamiento "similar al del navegador" wget
?
Puede intentar usar curl para descargar y mantener el nombre de archivo original:
ver opciones de línea de comando curl .
fuente
El enlace Google Docs realmente le dice a un script que se ejecute en el servidor, analizándolo en el archivo que desea. El archivo, que yo sepa, no existe nunca en el servidor en la forma els, pero se genera en tiempo de ejecución cuando lo solicita. Por lo tanto, no hay nada que wget pueda obtener.
Para descargar el archivo, deberá utilizar la API de Google http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/ .
fuente
.xls
archivo sobre la marcha. Sin embargo, un navegador completo no tiene ningún problema con esto. Entonces, obviamente, es posible prescindir de la API de Docs.