【发布时间】:2012-02-24 14:03:52
【问题描述】:
我正在使用雪球分析器来阻止多个文档的标题。一切都很好,但他们有一些怪癖。
例子:
搜索“valv”、“valve”或“valves”会返回相同数量的结果。这是有道理的,因为雪球分析仪将所有内容简化为“阀门”。
我在使用通配符时遇到了问题。搜索“valve*”或“valve*”不会返回任何结果。搜索“valv*”按预期工作。
我明白为什么会发生这种情况,但我不知道如何解决它。
我考虑编写一个分析器来存储词干和非词干标记。基本上应用两个分析器并组合两个令牌流。但我不确定这是否是一个实用的解决方案。
我也考虑过使用 AnalyzingQueryParser,但我不知道如何将其应用于多字段查询。此外,在搜索“阀门*”时,使用 AnalyzingQueryParser 将返回“阀门”的结果,这不是预期的行为。
是否有一种“首选”方式同时使用通配符和词干算法?
【问题讨论】:
标签: search lucene full-text-search lucene.net