【问题标题】:elasticsearch group by ID field and perform max on date fieldelasticsearch按ID字段分组并在日期字段上执行最大值
【发布时间】:2016-04-23 02:02:12
【问题描述】:

我的索引有如下所述的数据。

Id    version_number groupId   indexDate
1    v1                 1    2016-11-15T12:00:00
2    v1                 2    2016-11-20T12:00:00
3    v2                 2    2016-12-01T12:00:00
4    v1                 3    2016-13-01T12:00:00
5    v1                 4    2016-11-01T12:00:00
6    v2                 4    2016-13-01T12:00:00
7    v1                 5    2016-14-01T12:00:00

如何在 java 中编写 elasticsearch 查询。如果我按日期 2016-13-01T12:00:00 搜索,我希望看到 indexDate 小于或等于搜索日期的每个 groupId 的最新版本?

预期输出:

Id    version_number   groupId   indexDate
1    v1                  1       2016-13-01T12:00:00
2    v2                  2       2016-11-20T12:00:00
6    v3                  3       2016-10-01T12:00:00
7    v2                  4       2016-10-01T12:00:00 

我没有看到弹性搜索中日期字段的最大功能来实现这一点。

【问题讨论】:

  • 这是一个奇怪的约会2013-13-01T12:00:00;-)
  • 两个问题:为什么我们在您的预期输出中没有看到v4?为什么会有两个 id 为 6 的文档?
  • 我已经编辑了问题和答案。我在 o/p 中错误地错过了 v4。

标签: java elasticsearch spring-data-elasticsearch


【解决方案1】:

我将首先在 version_number 上进行聚合,然后使用按 indexDate 降序排序的 top_hits 子聚合并返回该存储桶的第一个文档的 ID。

{
  "size": 0,
  "aggs": {
    "by_version": {
      "terms": {
        "field": "version_number"
      },
      "aggs": {
        "max_date": {
          "top_hits": {
            "size": 1,
            "sort": {
              "indexDate": "desc"
            },
            "_source": [
              "id"
            ]
          }
        }
      }
    }
  }
}

【讨论】:

  • 我在 Java 中翻译了您的查询,如下所示。但无论我提供什么日期,它都会返回所有版本。你能复习一下吗? client.prepareSearch(versionIndexName).setTypes(versionIndexType).addAggregation(AggregationBuilders.terms("version").field("version").size(0) .subAggregation(AggregationBuilders.topHits("top").setExplain (true) .setSize(1) .setFrom((size * index)).addSort("versionDate",SortOrder.DESC).setFetchSource(true))).execute().actionGet();跨度>
  • 我不明白怎么了。 size(0) 将返回所有版本
猜你喜欢
  • 1970-01-01
  • 2021-02-03
  • 2018-02-12
  • 2020-12-07
  • 2021-05-27
  • 1970-01-01
  • 2018-07-20
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多