【问题标题】:Elasticsearch edge ngram tokenizer returns less relevant itemsElasticsearch 边缘 ngram 标记器返回不太相关的项目
【发布时间】:2019-06-19 16:03:08
【问题描述】:

我有边缘 ngram 分词器,可以制作这样的令牌:

  1. x 运动 => x s sp spo spor 运动
  2. sport active => s sp spo spor sport a ac act acti activ active
  3. xin xin sro => x xi xin x xi xin s sr sro

如果我向 x sport 发送请求,它将创建类似上面的令牌。 问题是这个请求结果包括 xin xin sro 并且不包括运动项目(前 20 个)。 xin xin 怎么可能比sport active 更匹配x 运动短语。我真的出去了。请帮忙。谢谢。

【问题讨论】:

  • 您需要确保在搜索时不要使用边缘 ngram 分析器,即不要像在索引时那样标记搜索输入
  • 为什么?你能解释一下吗?
  • 您的搜索查询是什么?
  • @Val 我有。你说的对。我需要在搜索时使用标准分析器elastic.co/guide/en/elasticsearch/guide/master/…

标签: elasticsearch token n-gram


【解决方案1】:

问题在于搜索时间的分析器错误。在我的情况下,它应该是标准的,而不是索引定义中基于边缘 ngram 的分析器。这里是解释https://www.elastic.co/guide/en/elasticsearch/guide/master/_index_time_search_as_you_type.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-03-11
    • 2020-08-28
    • 1970-01-01
    • 2011-12-25
    • 1970-01-01
    • 2015-10-02
    • 2020-12-27
    • 2021-01-18
    相关资源
    最近更新 更多