【问题标题】:lucene 3.0.3 | phrase query problemLucene 3.0.3 |短语查询问题
【发布时间】:2011-02-16 09:39:36
【问题描述】:

searchString = "我正在使用 sql。服务器设置很容易。";

当我在上面的字符串中搜索短语查询“Sql Server”时,它给出的结果不正确。如在上面的字符串 sql 和服务器由点(。)分隔

同时使用 PhraseQuery 和 SpanQuery 得到相同的结果。

任何建议将不胜感激!!!

【问题讨论】:

  • 你的文本是如何被索引的?你用什么分析仪?什么查询语法?

标签: lucene


【解决方案1】:

您可以编写一个分析器,它将点视为标记,因此您将获得 3 个标记 - “sql”、“.” (点)和“服务器”(我不知道任何现有的分析器,可以做到这一点)。但它可能会产生不可预知的结果,所以我建议您忽略这种罕见的情况。如果这不是一个选项,并且您的程序大量使用文本的词汇结构,我会建议使用一些 自然语言处理工具,例如 GATE,而不是 Lucene。

【讨论】:

    猜你喜欢
    • 2011-08-13
    • 1970-01-01
    • 2015-01-19
    • 1970-01-01
    • 2011-11-16
    • 1970-01-01
    • 1970-01-01
    • 2017-06-12
    • 1970-01-01
    相关资源
    最近更新 更多