【问题标题】:How to transfer Postgres Data from Query to S3 Efficiently如何有效地将 Postgres 数据从 Query 传输到 S3
【发布时间】:2020-11-27 22:17:20
【问题描述】:

我的 node.js 应用服务当前使用提供的选择查询访问 postgres,将其转换为 csv,然后将该 CSV 文件上传到 S3。

我想知道是否有更好的方法可以更有效地处理更大的数据拉取?

【问题讨论】:

    标签: node.js database postgresql amazon-s3 etl


    【解决方案1】:

    这应该会让你达到大约 90%。我还没有测试过这个确切的实现,可能有一两个错字,但我现在有类似的代码在生产中运行。

    const { Transform } = require('json2csv');
    const { Client, Query } = require('pg')
    const { S3 } = require('aws-sdk');
    const { Passthrough } = require('stream')
    
    const client = new Client()
    const s3 = new S3({ region: 'us-east-1' });
    
    
    const opts = { fields: ['field1', 'field2', 'field3'] };
    const transformOpts = { highWaterMark: 8192, encoding: 'utf-8', objectMode: true };
    
    const transform = new Transform(opts, transformOpts);
    const passthrough = new Passthrough();
    transform.pipe(passthrough)
    
    
    client.connect()
    
    const query = new Query('SELECT field1, field2, field3 FROM table')
    client.query(query)
    
    query.on('row', row => {
      transform.push(row);
      console.log('row!', row) // { field1: 1, field2: 2, field3: 3 }
    })
    query.on('end', () => {
      transform.push(null)
      console.log('query done')
    })
    query.on('error', err => {
      transform.end();
      console.error(err.stack)
    })
    
    s3.upload({ Body: passthrough, Key: 'somefile.csv', Bucket: 'some_bucket' })
    .send((err, data) => {
      if (err) {
        console.error({ err });
        passthrough.destroy(err);
      } else {
        console.log(`File uploaded and available at ${data.Location}`);
        passthrough.destroy();
      }
    });
    

    【讨论】:

    猜你喜欢
    • 2020-02-07
    • 2015-04-08
    • 2020-06-21
    • 2015-01-03
    • 2019-03-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多