【问题标题】:Downloading images with node.js [closed]使用 node.js 下载图像 [关闭]
【发布时间】:2012-09-26 06:42:49
【问题描述】:

我正在尝试编写一个脚本来使用 node.js 下载图像。这是我目前所拥有的:

var maxLength = 10 // 10mb
var download = function(uri, callback) {
  http.request(uri)
    .on('response', function(res) {
      if (res.headers['content-length'] > maxLength*1024*1024) {
        callback(new Error('Image too large.'))
      } else if (!~[200, 304].indexOf(res.statusCode)) {
        callback(new Error('Received an invalid status code.'))
      } else if (!res.headers['content-type'].match(/image/)) {
        callback(new Error('Not an image.'))
      } else {
        var body = ''
        res.setEncoding('binary')
        res
          .on('error', function(err) {
            callback(err)
          })
          .on('data', function(chunk) {
            body += chunk
          })
          .on('end', function() {
            // What about Windows?!
            var path = '/tmp/' + Math.random().toString().split('.').pop()
            fs.writeFile(path, body, 'binary', function(err) {
              callback(err, path)
            })
          })
      }
    })
    .on('error', function(err) {
      callback(err)
    })
    .end();
}

然而,我想让它更健壮:

  1. 是否有图书馆可以做到这一点并且做得更好?
  2. 响应标头是否存在谎言(关于长度、关于内容类型)?
  3. 还有其他我应该关心的状态代码吗?我应该为重定向而烦恼吗?
  4. 我想我在某处读到binary 编码将被弃用。那我该怎么办?
  5. 如何让它在 Windows 上运行?
  6. 还有其他方法可以让这个脚本变得更好吗?

为什么:对于类似于 imgur 的功能,用户可以给我一个 URL,我下载该图像,并以多种尺寸重新托管该图像。

【问题讨论】:

    标签: node.js image download


    【解决方案1】:

    您可以使用 Axios(基于 promise 的 Node.js HTTP 客户端)按照您在 asynchronous environment 中选择的顺序下载图像:

    npm i axios
    

    然后,您可以使用以下基本示例开始下载图像:

    const fs = require('fs');
    const axios = require('axios');
    
    /* ============================================================
      Function: Download Image
    ============================================================ */
    
    const download_image = (url, image_path) =>
      axios({
        url,
        responseType: 'stream',
      }).then(
        response =>
          new Promise((resolve, reject) => {
            response.data
              .pipe(fs.createWriteStream(image_path))
              .on('finish', () => resolve())
              .on('error', e => reject(e));
          }),
      );
    
    /* ============================================================
      Download Images in Order
    ============================================================ */
    
    (async () => {
      let example_image_1 = await download_image('https://example.com/test-1.png', 'example-1.png');
    
      console.log(example_image_1.status); // true
      console.log(example_image_1.error); // ''
    
      let example_image_2 = await download_image('https://example.com/does-not-exist.png', 'example-2.png');
    
      console.log(example_image_2.status); // false
      console.log(example_image_2.error); // 'Error: Request failed with status code 404'
    
      let example_image_3 = await download_image('https://example.com/test-3.png', 'example-3.png');
    
      console.log(example_image_3.status); // true
      console.log(example_image_3.error); // ''
    })();
    

    【讨论】:

    • 很好的例子!但几乎不可读的代码,试试standard 风格:D
    • @camwhite 我更喜欢semicolons。 ;)
    • 您确实应该将“完成”和“错误”事件附加到写入流,将它们包装在 Promise 中并返回 Promise。否则您可能会尝试访问尚未完全下载的图像。
    • 在尝试访问之前等待不会确保图像完全下载吗? @jwerre
    • @jwerre @FabricioG 我已经更新了函数 download_image 以捕获返回的承诺的“完成”和“错误”事件
    【解决方案2】:

    这是对 Cezary 答案的扩展。如果要将其下载到特定目录,请使用它。另外,使用 const 代替 var。这样就安全了。

    const fs = require('fs');
    const request = require('request');
    var download = function(uri, filename, callback){
      request.head(uri, function(err, res, body){    
        request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
      });
    };
    
    download('https://www.google.com/images/srpr/logo3w.png', './images/google.png', function(){
      console.log('done');
    });
    

    【讨论】:

      【解决方案3】:
      var fs = require('fs'),
      http = require('http'),
      https = require('https');
      
      var Stream = require('stream').Transform;
      
      var downloadImageToUrl = (url, filename, callback) => {
      
          var client = http;
          if (url.toString().indexOf("https") === 0){
            client = https;
           }
      
          client.request(url, function(response) {                                        
            var data = new Stream();                                                    
      
            response.on('data', function(chunk) {                                       
               data.push(chunk);                                                         
            });                                                                         
      
            response.on('end', function() {                                             
               fs.writeFileSync(filename, data.read());                               
            });                                                                         
         }).end();
      };
      
      downloadImageToUrl('https://www.google.com/images/srpr/logo11w.png', 'public/uploads/users/abc.jpg');
      

      【讨论】:

      • 你的函数没有触发回调
      【解决方案4】:

      如果你想要进度下载试试这个:

      var fs = require('fs');
      var request = require('request');
      var progress = require('request-progress');
      
      module.exports = function (uri, path, onProgress, onResponse, onError, onEnd) {
          progress(request(uri))
          .on('progress', onProgress)
          .on('response', onResponse)
          .on('error', onError)
          .on('end', onEnd)
          .pipe(fs.createWriteStream(path))
      };
      

      使用方法:

        var download = require('../lib/download');
        download("https://www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png", "~/download/logo.png", function (state) {
                  console.log("progress", state);
              }, function (response) {
                  console.log("status code", response.statusCode);
              }, function (error) {
                  console.log("error", error);
              }, function () {
                  console.log("done");
              });
      

      注意:您应该使用以下方式安装请求和请求进度模块:

      npm install request request-progress --save
      

      【讨论】:

      • 这很好,但想建议添加statusCode 检查。例如,一个 500 statusCode 不会命中 'on("error", e)。通过添加on('response', (response) => console.error(response.statusCode)) 极大地方便了调试,
      • 你可以编辑我的答案:)
      【解决方案5】:

      几天前我遇到了这个问题,对于纯 NodeJS 的答案,我建议使用 Stream 将块合并在一起。

      var http = require('http'),                                                
          Stream = require('stream').Transform,                                  
          fs = require('fs');                                                    
      
      var url = 'http://www.google.com/images/srpr/logo11w.png';                    
      
      http.request(url, function(response) {                                        
        var data = new Stream();                                                    
      
        response.on('data', function(chunk) {                                       
          data.push(chunk);                                                         
        });                                                                         
      
        response.on('end', function() {                                             
          fs.writeFileSync('image.png', data.read());                               
        });                                                                         
      }).end();
      

      最新的 Node 版本不能很好地处理二进制字符串,因此在处理二进制数据时将块与字符串合并不是一个好主意。

      *使用 'data.read()' 时要小心,它会为下一个 'read()' 操作清空流。如果您想多次使用它,请将其存放在某个地方。

      【讨论】:

      • 为什么不直接将下载流式传输到磁盘?
      • 在创建损坏文件时将字符串分块在一起存在很多问题,但这样做了
      • 您也可以使用数组作为data,并将data.read() 替换为Buffer.concat(data)。这样我们就不需要导入流模块了
      • 对于https://... url,使用https 模块,如@chandan-chhajer's answer 所示。
      • 如何使用它检查错误?我正在下载一个文件,该文件最终以某种方式损坏......试图调试它。设置编码是否可行?
      【解决方案6】:

      在上述基础上,如果有人需要处理写入/读取流中的错误,我使用了这个版本。请注意stream.read(),以防出现写入错误,这是必需的,以便我们可以完成读取并在读取流上触发close

      var download = function(uri, filename, callback){
        request.head(uri, function(err, res, body){
          if (err) callback(err, filename);
          else {
              var stream = request(uri);
              stream.pipe(
                  fs.createWriteStream(filename)
                      .on('error', function(err){
                          callback(error, filename);
                          stream.read();
                      })
                  )
              .on('close', function() {
                  callback(null, filename);
              });
          }
        });
      };
      

      【讨论】:

      • stream.read() 似乎已经过时,抛出错误not a function
      【解决方案7】:

      我建议使用request module。下载文件很简单,如下代码:

      var fs = require('fs'),
          request = require('request');
      
      var download = function(uri, filename, callback){
        request.head(uri, function(err, res, body){
          console.log('content-type:', res.headers['content-type']);
          console.log('content-length:', res.headers['content-length']);
      
          request(uri).pipe(fs.createWriteStream(filename)).on('close', callback);
        });
      };
      
      download('https://www.google.com/images/srpr/logo3w.png', 'google.png', function(){
        console.log('done');
      });
      

      【讨论】:

      • 酷!有没有办法在实际下载之前检查大小和内容类型?
      • 将图片下载到哪里?
      • 不适合我(图片已损坏
      • @Gofilord 将图像下载到您的根目录。
      • request 已弃用。
      猜你喜欢
      • 2018-01-23
      • 1970-01-01
      • 2015-03-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多