【问题标题】:Fuzziness in phrase matching in elasticsearch弹性搜索中短语匹配的模糊性
【发布时间】:2017-01-19 23:08:22
【问题描述】:

如何在词组匹配中包含模糊性?在弹性搜索文档中提到短语匹配不支持模糊性。 我有包含短语的文档现在我有一个文本正文,现在我想找出文档中文本和短语的常用短语,但需要搜索可能拼写错误的短语。

【问题讨论】:

    标签: elasticsearch


    【解决方案1】:

    有一些方法可以做到这一点:

    1. 删除空白并将孔短语索引为一个标记(我认为 Elastic 中有一个过滤器)。在您的查询中,您也必须这样做。
    2. 有一个 Tokenizer,我忘记了它的名字(也许有人可以在这里帮忙?)它可以让你索引多个单词。如果你的短语有一个共同的最大长度,比如 5 个单词左右,那么这可以解决问题。

    注意 fuzzi 仅适用于最大距离 2,因此如果您的句子很长,则 2 可能不够,您必须拆分它。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-05-08
      • 1970-01-01
      • 2012-02-01
      • 1970-01-01
      • 2014-08-23
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多