【问题标题】:How to format a timestamp from DynamoDB for Elasticsearch/Kibana?如何从 DynamoDB for Elasticsearch/Kibana 格式化时间戳?
【发布时间】:2017-12-17 22:02:48
【问题描述】:

我正在将 DynamoDB 行推送到 Elasticsearch 集群中。日期字段是 unix 时间戳Kibana 不会将其识别为日期。

我阅读了Elasticsearch mapping types 并找到了this post,但不知道在我的 Lambda 脚本中的何处实现映射:

/* ... requires and config ... */

exports.handler = (event, context, callback) => {        
    event.Records.forEach((record) => {
        var dbRecord = JSON.stringify(record.dynamodb);
        postToES(dbRecord, context, callback);
    });
};

function postToES(doc, context, lambdaCallback) {
    var req = new AWS.HttpRequest(endpoint);

    req.method = 'POST';
    req.path = path.join('/', esDomain.index, esDomain.doctype);
    req.region = esDomain.region;
    req.headers['presigned-expires'] = false;
    req.headers['Host'] = endpoint.host;
    req.body = doc; 

    // Maybe here?

    var signer = new AWS.Signers.V4(req , 'es');  
    signer.addAuthorization(creds, new Date());

    var send = new AWS.NodeHttpClient();
    send.handleRequest(req, null, function(httpResp) {
        var respBody = '';
        httpResp.on('data', function (chunk) {
            respBody += chunk;
        });
        httpResp.on('end', function (chunk) {
            lambdaCallback(null,'Lambda added document ' + doc);
        });
    }, function(err) {
        console.log('Error: ' + err);
        lambdaCallback('Lambda failed with error ' + err);
    });
}

Elasticsearch 文档

{
    _index: "posts",
    _type: "post",
    _id: "6YKF2AAV06RSSRrzv6R-",
    _version: 1,
    found: true,
    _source: {
        ApproximateCreationDateTime: 1499922960,
        Keys: {
            id: {
                S: "7asda8b0-628a-11e7-9e5e-25xyc7179dx7"
            }
        },
        NewImage: {
            posted_at: {
                N: "1499922995401"
            },
            id: {
                S: "7asda8b0-628a-11e7-9e5e-25xyc7179dx7"
            }
        },
        SequenceNumber: "2442423900000000003279639454",
        SizeBytes: 221,
        StreamViewType: "NEW_AND_OLD_IMAGES"
    }
}

Dynamoose 架构

var Schema = dynamoose.Schema;
var s = new Schema({
    id: {
        type: String,
        hashKey: true,
        required: true
    },
    posted_at: {
        type: Date,
        required: true
    }
});

module.exports = dynamoose.model('posts', s);

示例:在我的 DynamoDB 表中,我有字段 posted_at。内容是一个 Unix 时间戳。在 Kiabana 中,它的索引为

  • NewImage.posted_at.N (类型:字符串,可搜索,已分析)
  • NewImage.posted_at.N.keyword (类型:字符串,可搜索,可聚合)

我对@9​​87654329@ 和type: string 感到困惑。

有什么想法吗? 谢谢!

【问题讨论】:

  • 你能展示一下 ES 为你创建的映射吗?
  • 谢谢。你也可以展示一个示例文档吗?
  • 不,我需要一个已被 ES 索引的文档,而不是来自 DynamoDB 的文档
  • 知道为什么{ "posted_at": 1498794511820 } 会变成{ "posted_at": {"N": "1498794511820"} } 吗?
  • 您介意分享您的 Dynamoose 代码吗?

标签: javascript amazon-web-services elasticsearch amazon-dynamodb kibana


【解决方案1】:

好的,原来N 用来表示DynamoDB attribute type(即N 代表Number)。

问题是数字被字符串化并因此被索引为 ES 中的字符串(即您当前在映射中看到的内容)。

我们可以使用动态模板定义来解决这个问题。首先删除 ES 中的索引和 Kibana 中对应的索引模式。然后运行这个命令:

curl -XPUT localhost:9200/_template/post_template -d '{
  "template": "posts",
  "mappings": {
    "post": {
      "dynamic_templates": [
        {
          "dates": {
            "path_match": "NewImage.posted_at.N",
            "mapping": {
              "type": "date"
            }
          }
        },
        {
          "strings": {
            "match_mapping_type": "string",
            "mapping": {
              "type": "text",
              "fields": {
                "raw": {
                  "type":  "keyword",
                  "ignore_above": 256
                }
              }
            }
          }
        }
      ]
    }
  }
}'

最后你可以通过 Dynamoose 重新索引你的数据,之后你应该可以在 Kibana 中找到一个日期字段。

【讨论】:

  • 天啊,stringify(),当然!谢谢!它是什么类型的模板,我应该在哪里运行它? :)
  • 你需要在你的ES服务器中安装这个模板。我已将命令更新为使用 curl。
  • 太棒了,很高兴它有帮助!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-11-27
  • 2019-06-12
  • 2019-02-17
  • 2022-07-24
相关资源
最近更新 更多