使用 node.js 下载图像 [关闭]答案

【问题标题】：Downloading images with node.js [closed]使用 node.js 下载图像 [关闭]
【发布时间】：2012-09-26 06:42:49
【问题描述】：

我正在尝试编写一个脚本来使用 node.js 下载图像。这是我目前所拥有的：

var maxLength = 10 // 10mb
var download = function(uri, callback) {
  http.request(uri)
    .on('response', function(res) {
      if (res.headers['content-length'] > maxLength*1024*1024) {
        callback(new Error('Image too large.'))
      } else if (!~[200, 304].indexOf(res.statusCode)) {
        callback(new Error('Received an invalid status code.'))
      } else if (!res.headers['content-type'].match(/image/)) {
        callback(new Error('Not an image.'))
      } else {
        var body = ''
        res.setEncoding('binary')
        res
          .on('error', function(err) {
            callback(err)
          })
          .on('data', function(chunk) {
            body += chunk
          })
          .on('end', function() {
            // What about Windows?!
            var path = '/tmp/' + Math.random().toString().split('.').pop()
            fs.writeFile(path, body, 'binary', function(err) {
              callback(err, path)
            })
          })
      }
    })
    .on('error', function(err) {
      callback(err)
    })
    .end();
}

然而，我想让它更健壮：

是否有图书馆可以做到这一点并且做得更好？
响应标头是否存在谎言（关于长度、关于内容类型）？
还有其他我应该关心的状态代码吗？我应该为重定向而烦恼吗？
我想我在某处读到binary 编码将被弃用。那我该怎么办？
如何让它在 Windows 上运行？
还有其他方法可以让这个脚本变得更好吗？

为什么：对于类似于 imgur 的功能，用户可以给我一个 URL，我下载该图像，并以多种尺寸重新托管该图像。

【问题讨论】：

标签： node.js image download

【解决方案1】：

您可以使用 Axios（基于 promise 的 Node.js HTTP 客户端）按照您在 asynchronous environment 中选择的顺序下载图像：

npm i axios

然后，您可以使用以下基本示例开始下载图像：

const fs = require('fs');
const axios = require('axios');

/* ============================================================
  Function: Download Image
============================================================ */

const download_image = (url, image_path) =>
  axios({
    url,
    responseType: 'stream',
  }).then(
    response =>
      new Promise((resolve, reject) => {
        response.data
          .pipe(fs.createWriteStream(image_path))
          .on('finish', () => resolve())
          .on('error', e => reject(e));
      }),
  );

/* ============================================================
  Download Images in Order
============================================================ */

(async () => {
  let example_image_1 = await download_image('https://example.com/test-1.png', 'example-1.png');

  console.log(example_image_1.status); // true
  console.log(example_image_1.error); // ''

  let example_image_2 = await download_image('https://example.com/does-not-exist.png', 'example-2.png');

  console.log(example_image_2.status); // false
  console.log(example_image_2.error); // 'Error: Request failed with status code 404'

  let example_image_3 = await download_image('https://example.com/test-3.png', 'example-3.png');

  console.log(example_image_3.status); // true
  console.log(example_image_3.error); // ''
})();

【讨论】：

很好的例子！但几乎不可读的代码，试试standard 风格：D
@camwhite 我更喜欢semicolons。 ;)
您确实应该将“完成”和“错误”事件附加到写入流，将它们包装在 Promise 中并返回 Promise。否则您可能会尝试访问尚未完全下载的图像。
在尝试访问之前等待不会确保图像完全下载吗？ @jwerre
@jwerre @FabricioG 我已经更新了函数 download_image 以捕获返回的承诺的“完成”和“错误”事件

【解决方案2】：

这是对 Cezary 答案的扩展。如果要将其下载到特定目录，请使用它。另外，使用 const 代替 var。这样就安全了。

const fs = require('fs');
const request = require('request');
var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){    
    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', './images/google.png', function(){
  console.log('done');
});

【讨论】：

【解决方案3】：

var fs = require('fs'),
http = require('http'),
https = require('https');

var Stream = require('stream').Transform;

var downloadImageToUrl = (url, filename, callback) => {

    var client = http;
    if (url.toString().indexOf("https") === 0){
      client = https;
     }

    client.request(url, function(response) {                                        
      var data = new Stream();                                                    

      response.on('data', function(chunk) {                                       
         data.push(chunk);                                                         
      });                                                                         

      response.on('end', function() {                                             
         fs.writeFileSync(filename, data.read());                               
      });                                                                         
   }).end();
};

downloadImageToUrl('https://www.google.com/images/srpr/logo11w.png', 'public/uploads/users/abc.jpg');

【讨论】：

你的函数没有触发回调

【解决方案4】：

如果你想要进度下载试试这个：

var fs = require('fs');
var request = require('request');
var progress = require('request-progress');

module.exports = function (uri, path, onProgress, onResponse, onError, onEnd) {
    progress(request(uri))
    .on('progress', onProgress)
    .on('response', onResponse)
    .on('error', onError)
    .on('end', onEnd)
    .pipe(fs.createWriteStream(path))
};

使用方法：

  var download = require('../lib/download');
  download("https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png", "~/download/logo.png", function (state) {
            console.log("progress", state);
        }, function (response) {
            console.log("status code", response.statusCode);
        }, function (error) {
            console.log("error", error);
        }, function () {
            console.log("done");
        });

注意：您应该使用以下方式安装请求和请求进度模块：

npm install request request-progress --save

【讨论】：

这很好，但想建议添加statusCode 检查。例如，一个 500 statusCode 不会命中 'on("error", e)。通过添加on('response', (response) => console.error(response.statusCode)) 极大地方便了调试，
你可以编辑我的答案:)

【解决方案5】：

几天前我遇到了这个问题，对于纯 NodeJS 的答案，我建议使用 Stream 将块合并在一起。

var http = require('http'),                                                
    Stream = require('stream').Transform,                                  
    fs = require('fs');                                                    

var url = 'http://www.google.com/images/srpr/logo11w.png';                    

http.request(url, function(response) {                                        
  var data = new Stream();                                                    

  response.on('data', function(chunk) {                                       
    data.push(chunk);                                                         
  });                                                                         

  response.on('end', function() {                                             
    fs.writeFileSync('image.png', data.read());                               
  });                                                                         
}).end();

最新的 Node 版本不能很好地处理二进制字符串，因此在处理二进制数据时将块与字符串合并不是一个好主意。

*使用 'data.read()' 时要小心，它会为下一个 'read()' 操作清空流。如果您想多次使用它，请将其存放在某个地方。

【讨论】：

为什么不直接将下载流式传输到磁盘？
在创建损坏文件时将字符串分块在一起存在很多问题，但这样做了
您也可以使用数组作为data，并将data.read() 替换为Buffer.concat(data)。这样我们就不需要导入流模块了
对于https://... url，使用https 模块，如@chandan-chhajer's answer 所示。
如何使用它检查错误？我正在下载一个文件，该文件最终以某种方式损坏......试图调试它。设置编码是否可行？

【解决方案6】：

在上述基础上，如果有人需要处理写入/读取流中的错误，我使用了这个版本。请注意stream.read()，以防出现写入错误，这是必需的，以便我们可以完成读取并在读取流上触发close。

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    if (err) callback(err, filename);
    else {
        var stream = request(uri);
        stream.pipe(
            fs.createWriteStream(filename)
                .on('error', function(err){
                    callback(error, filename);
                    stream.read();
                })
            )
        .on('close', function() {
            callback(null, filename);
        });
    }
  });
};

【讨论】：

stream.read() 似乎已经过时，抛出错误not a function

【解决方案7】：

我建议使用request module。下载文件很简单，如下代码：

var fs = require('fs'),
    request = require('request');

var download = function(uri, filename, callback){
  request.head(uri, function(err, res, body){
    console.log('content-type:', res.headers['content-type']);
    console.log('content-length:', res.headers['content-length']);

    request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
  });
};

download('https://www.google.com/images/srpr/logo3w.png', 'google.png', function(){
  console.log('done');
});

【讨论】：

酷！有没有办法在实际下载之前检查大小和内容类型？
将图片下载到哪里？
不适合我（图片已损坏
@Gofilord 将图像下载到您的根目录。
request 已弃用。