【问题标题】:Elastic Search Limiting the records that are aggregated弹性搜索限制聚合的记录
【发布时间】:2016-07-07 15:49:41
【问题描述】:

我正在运行一个带有聚合的弹性搜索查询,我打算将其限制为 100 条记录。问题是即使我应用了“大小”过滤器,对聚合也没有影响。

GET /index_name/index_type/_search
{
  "size":0,
  "query":{
    "match_all": {}
  },
  "aggregations":{
    "courier_code" : {
      "terms" : {
        "field" : "city"
      }
  }
}}

结果集是

{
  "took": 7,
  "timed_out": false,
  "_shards": {
    "total": 10,
    "successful": 10,
    "failed": 0
  },
  "hits": {
    "total": 10867,
    "max_score": 0,
    "hits": []
  },
  "aggregations": {
    "city": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "Mumbai",
          "doc_count": 2706
        },
        {
          "key": "London",
          "doc_count": 2700
        },
        {
          "key": "Patna",
          "doc_count": 1800
        },
        {
          "key": "New York",
          "doc_count": 1800
        },
        {
          "key": "Melbourne",
          "doc_count": 900
        }
      ]
    }
  }
}

如您所见,对限制要执行聚合的记录没有影响。是否有过滤器,例如 Elastic Search 中的前 100 条记录。

【问题讨论】:

    标签: elasticsearch


    【解决方案1】:

    elasticsearch 中的搜索操作在queryfetch 两个阶段执行。在第一阶段,elasticsearch 从所有分片中获取结果,对它们进行排序并确定应该返回哪些记录。然后在第二阶段检索这些记录。 size 参数控制响应中返回给您的记录数。在弹性搜索实际上知道需要检索哪些记录之前的第一阶段执行聚合,并且它们始终在搜索中的所有记录上执行。因此,不可能通过结果总数来限制它。如果要限制聚合执行的范围,则需要限制搜索查询而不是更改检索参数。例如,如果您在搜索查询中添加一个过滤器,该过滤器将仅包含去年的记录,则将在此过滤器上执行聚合。

    也可以使用terminate_after 参数限制在每个分片上分析的记录数,但是您无法控制哪些记录将被包含,哪些记录不会被包含包含在结果中,因此此选项很可能不是您想要的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-03-10
      • 2019-11-08
      • 2021-02-19
      • 2023-03-18
      • 2021-10-11
      • 1970-01-01
      相关资源
      最近更新 更多