【问题标题】:calculate count of distinct value in child array by elasticSearch?通过elasticSearch计算子数组中不同值的计数?
【发布时间】:2021-03-15 13:00:41
【问题描述】:

我有这个结构的索引:

class Note {
    public string Text {get; set;}
    public string[] Tags {get; set;}
}

我想获得分配给所有笔记的每个不同标签的使用计数。 例如在这个数据上:

[
    {
        "_id" : 1
        "text":"first text",
        "tags" : ["TagA", "TagB"]
    },

    {
       "_id" : 2
       "text": "second text",
       "tags" : ["TagA", "TagC"]
    }
]

我希望得到这样的结果:

[
    {
      "Tag":"TagA",
      "count":2,
    },
   
   {
      "Tag":"TagB",
      "count":1,
   },
   
   {
      "Tag":"TagC",
      "count":1,
   }

]

我可以通过 ElasticSearch 生成此结果吗?如果答案是“是”,请指导我。另外,我想通过用户输入的一些词来过滤标签。

更新: 这是我的索引的映射:

{
  "Nots" : {
    "mappings" : {
      "properties" : {
        "tags" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "text" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
} 

更新 2:

我通过此代码过滤了条目:

POST publishers_inventories/_search
{
  "size": 0, 
  "query": {
    "bool": {
      "must": [
        {
          "query_string": {
            "default_field": "tags.keyword",
            "query": "*تگ*"
          }
        }
      ]
    }
  },
  "aggs": {
    "distinct_tags": {
      "terms": {
        "field": "tags.keyword",
        "size": 200
      }
    }
  }
}

但现在结果包含已过滤文档中包含的所有标签。例如,如果我搜索“Win”短语,它会返回标签中包含“Win”的所有文档,但所有其他短语都放在结果文档中的“Win”旁边。

【问题讨论】:

    标签: c# elasticsearch nest


    【解决方案1】:

    是的,您可以像这样简单地使用terms aggregation

    {
      "size": 0,
      "query": {
        "match": {
          "tags": "win"
        }
      },
      "aggs": {
        "distinct_tags": {
          "terms": {
            "field": "tags.keyword",
            "size": 10
          }
        }
      }
    }
    

    【讨论】:

    • 我可以在这个结果上添加一些过滤器吗?例如标签,那些包含“win”短语?
    • 我测试过了,但过滤器部分不起作用:(
    • 请用您的索引映射的详细信息更新您的问题
    • 我通过 ** "query": { "bool": { "must": [ { "query_string": { "default_field": "tags.keyword", "query": "礼带" } } ] } }**
    • 如果使用query_string,则需要查询tags字段,而不是tags.keyword字段。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-12-28
    • 1970-01-01
    • 1970-01-01
    • 2015-12-03
    • 1970-01-01
    • 2018-04-01
    • 1970-01-01
    相关资源
    最近更新 更多