Descarga de un archivo grande usando curl

87

Necesito descargar un archivo remoto usando curl.

Aquí está el código de muestra que tengo:

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

$st = curl_exec($ch);
$fd = fopen($tmp_name, 'w');
fwrite($fd, $st);
fclose($fd);

curl_close($ch);

Pero no puede manejar archivos grandes, porque primero lee en la memoria.

¿Es posible transmitir el archivo directamente al disco?

kusanagi
fuente

Respuestas:

168
<?php
set_time_limit(0);
//This is the file where we save the    information
$fp = fopen (dirname(__FILE__) . '/localfile.tmp', 'w+');
//Here is the file we are downloading, replace spaces with %20
$ch = curl_init(str_replace(" ","%20",$url));
curl_setopt($ch, CURLOPT_TIMEOUT, 50);
// write curl response to file
curl_setopt($ch, CURLOPT_FILE, $fp); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
// get curl response
curl_exec($ch); 
curl_close($ch);
fclose($fp);
?>
El cerebro
fuente
5
Defiende tu comentario @ yes123, me interesa saberlo.
Jürgen Paul
8
Corrígeme si me equivoco, pero no creo que realmente necesites manualmente fwritelos datos ya que estás usando CURLOPT_FILE.
Sasha Chedygov
1
Como @SashaChedygov ha señalado anteriormente, no necesita usar fwriteAND CURLOPT_FILE. Pasar el $fpes suficiente. Hice ambas cosas y terminé 1al final del contenido del archivo.
clip
@Sasha Chedygov ~ sí, no necesitas elfwrite
Alireza
5
Parece que configurar CURLOPT_FILE antes de configurar CURLOPT_RETURNTRANSFER no funciona, presumiblemente porque CURLOPT_FILE depende de que CURLOPT_RETURNTRANSFER esté configurado. php.net/manual/en/function.curl-setopt.php#99082
Nabi KAZ
25

Yo uso esta práctica función:

Al descargarlo con un paso de 4094 bytes, no llenará su memoria

function download($file_source, $file_target) {
    $rh = fopen($file_source, 'rb');
    $wh = fopen($file_target, 'w+b');
    if (!$rh || !$wh) {
        return false;
    }

    while (!feof($rh)) {
        if (fwrite($wh, fread($rh, 4096)) === FALSE) {
            return false;
        }
        echo ' ';
        flush();
    }

    fclose($rh);
    fclose($wh);

    return true;
}

Uso:

     $result = download('http://url','path/local/file');

Luego puede verificar si todo está bien con:

     if (!$result)
         throw new Exception('Download error...');
dinámica
fuente
1
@Severus, detecta el error http que fopen()devuelve falso y el tiempo de espera lo coloca en el ciclo while (llame time()y haga los cálculos)
Silviu-Marian
2
cURL ya tiene una implementación funcional de esto (vea la respuesta aceptada), ¿por qué querría implementar algo por su cuenta?
Petr Peller
2
Porque la interfaz de procedimiento cURL es bastante mala
dinámica
por lo que vale, he estado usando en stream_copy_to_streamlugar de copiar contenido manualmente, hace un código más corto. Ni esto ni aquello funciona con https(a menos que estipule a $context). Concertar el estilo de procedimiento: las funciones de archivo no son del todo OOP también, y si coloca las opciones de curl en una matriz, se verá mucho más limpio de todos modos.
Ashein
Lo probé con un https, funciona genial !!!, Gracias por tu ayuda @dynamic.
Ozal Zarbaliyev
6

Encuentre el código a continuación si desea descargar el contenido de la URL especificada y también desea guardarlo en un archivo.

<?php
$ch = curl_init();
/**
* Set the URL of the page or file to download.
*/
curl_setopt($ch, CURLOPT_URL,'http://news.google.com/news?hl=en&topic=t&output=rss');

$fp = fopen('rss.xml', 'w+');
/**
* Ask cURL to write the contents to a file
*/
curl_setopt($ch, CURLOPT_FILE, $fp);

curl_exec ($ch);

curl_close ($ch);
fclose($fp);
?>

Si desea descargar archivos desde el servidor FTP, puede usar la extensión php FTP. Encuentre el siguiente código:

<?php
$SERVER_ADDRESS="";
$SERVER_USERNAME="";
$SERVER_PASSWORD="";
$conn_id = ftp_connect($SERVER_ADDRESS);

// login with username and password
$login_result = ftp_login($conn_id, $SERVER_USERNAME, $SERVER_PASSWORD);

$server_file="test.pdf" //FTP server file path 
$local_file = "new.pdf"; //Local server file path 

##----- DOWNLOAD $SERVER_FILE AND SAVE TO $LOCAL_FILE--------##
if (ftp_get($conn_id, $local_file, $server_file, FTP_BINARY)) {
    echo "Successfully written to $local_file\n";
} else {
    echo "There was a problem\n";
}

ftp_close($conn_id);
?>
Sanjeev Chauhan
fuente
4

cuando curlse usa para descargar un archivo grande, entonces CURLOPT_TIMEOUTes la opción principal que debe configurar.

CURLOPT_RETURNTRANSFER tiene que ser cierto en caso de que obtenga un archivo como pdf / csv / image, etc.

Puede encontrar más detalles aquí (URL correcta) Curl Doc

De esa página:

curl_setopt($request, CURLOPT_TIMEOUT, 300); //set timeout to 5 mins

curl_setopt($request, CURLOPT_RETURNTRANSFER, true); // true to get the output as string otherwise false
pandey prashant
fuente
u también puede pasar por el ejemplo el blog respecto de descarga de archivos con el enrollamiento de fundamentos enrollamiento comprensión
Pandey Prashant
2

Puede usar esta función, que crea un archivo temporal en el sistema de archivos y devuelve la ruta al archivo descargado si todo funcionó bien:

function getFileContents($url)
{
    // Workaround: Save temp file
    $img = tempnam(sys_get_temp_dir(), 'pdf-');
    $img .= '.' . pathinfo($url, PATHINFO_EXTENSION);

    $fp = fopen($img, 'w+');

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);
    curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);

    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_FILE, $fp);
    curl_setopt($ch, CURLOPT_HEADER, false);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

    $result = curl_exec($ch);
    curl_close($ch);

    fclose($fp);

    return $result ? $img : false;
}
Matthias Kleine
fuente