【问题标题】:Lucene phrase searchLucene 短语搜索
【发布时间】:2012-12-09 16:24:26
【问题描述】:

我有大文本文档。比如说,如果我搜索“计算机 m”,那么我想得到“计算机显示器”、“计算机内存”和“计算机市场份额”。如何仅获取匹配的短语?

我应该使用 ShingleAnalyzerWrapper 索引文件吗? 我应该为此使用 SpellChecker 吗?

我该怎么做?

【问题讨论】:

  • 你为什么假设“m”应该匹配“monitor”或“memory”?您是否尝试过使用“computer m*”进行通配符搜索?

标签: search lucene lucene.net


【解决方案1】:

org.apache.lucene.search.highlight.Highlighter 用于从找到的文档中提取最匹配的文本。就像 Google 如何在您的搜索结果中突出显示(或以粗体显示)匹配文本一样。

此博客条目可能会帮助您开始使用它: http://hrycan.com/2009/10/25/lucene-highlighter-howto/

【讨论】:

    【解决方案2】:

    您可以为此使用MultiPhraseQuery

    【讨论】:

    • 这是否让我为输入“计算机份额”输出“计算机市场份额”?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-07-28
    • 2015-10-19
    • 2012-02-22
    • 1970-01-01
    • 2013-08-08
    • 2014-02-16
    相关资源
    最近更新 更多