【问题标题】:Flatten elastic search _source output展平弹性搜索_source输出
【发布时间】:2020-03-27 14:07:02
【问题描述】:

我在使用 Elastic Search (ES) 检索 JSON 对象时遇到问题。现在,当我尝试使用下面的请求体从 ES 中查询一些数据时,

"_source": [
    "data.id",
    "data.completed",
    "data.label",
    "data.url",
    "data.mobile"
],

"query": {
    ...
}

我总是以

的形式得到响应
{
    "took": 225,
    "timed_out": false,
    "_shards": {
        ...
    },
    "hits": {
        "total": {
            ...
        },
        "max_score": null,
        "hits": [
            {
                ...

                "_source": {
                    "data": {
                        "mobile": 1,
                        "label": "EU Mobile Test",
                        "completed": 1582990420,
                        "id": "2002",
                        "url": "http://www.example.com/"
                    }
                },

                ...
            },


          ...
        ]
    }
}

有没有一种方法可以直接通过请求正文检索 JSON 子级信息?使响应类似于:

 {
    "took": 225,
    "timed_out": false,
    "_shards": {
        ...
    },
    "hits": {
        "total": {
            ...
        },
        "max_score": null,
        "hits": [
            {
                ...

                "_source": {
                        "mobile": 1,
                        "label": "EU Mobile Test",
                        "completed": 1582990420,
                        "id": "2002",
                        "url": "http://www.example.com/"
                },

                ...
            },


          ...
        ]
    }
}

【问题讨论】:

  • 请问您这样做的原因是什么?你要解决什么问题?
  • 我正在尝试使用 Redash 可视化 Elastic Search 返回的数据。但是 Redash 似乎无法识别第一种数据格式。
  • Elasticsearch 响应如何输入到 Redash?

标签: elasticsearch elasticsearch-dsl


【解决方案1】:

您无法更改 hit 中的 _source 属性的结构方式,除非像您所做的那样限制使用 _source 返回的内容。


您可以随意使用脚本字段:

GET biao/_search
{
  "_source": "extracted_data",
  "script_fields": {
    "extracted_data": {
      "script": {
        "source": """
        def map = [:];
        for (def field : params['data_fields']) {
          try {
            map[field] = doc['data.' + field].value;  
          } catch(Exception e){
            try {
              map[field] = doc['data.' + field + '.keyword'][0];  
            } catch(Exception ee) {

            }
          }
        }
        return map;

        """,
        "params": {
          "data_fields": [
            "mobile",
            "label",
            "completed",
            "id",
            "url"
          ]
        }
      }
    }
  }
}

屈服

"hits" : [
      {
        "_index" : "biao",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : { },
        "fields" : {
          "extracted_data" : [
            {
              "mobile" : 1,
              "label" : "EU Mobile Test",
              "completed" : 1582990420,
              "id" : "2002",
              "url" : "http://www.example.com/"
            }
          ]
        }
      }
    ]

但现在您遇到了一个新问题,因为您需要使用fields.extracted_data[0] 访问数据;)。

再次阅读 redash 文档 -- 必须有更简洁的方法!

【讨论】:

    猜你喜欢
    • 2014-10-23
    • 2018-11-03
    • 2016-08-28
    • 1970-01-01
    • 2014-08-16
    • 2022-12-04
    • 1970-01-01
    • 2020-06-29
    • 1970-01-01
    相关资源
    最近更新 更多