【发布时间】:2012-11-19 04:11:28
【问题描述】:
我正在使用 Lucene.NET contrib NuGet 包 v3.0.3 中的拼写检查器。
拼写检查索引是使用_spellChecker.IndexDictionary(new SpellChecker.Net.Search.Spell.LuceneDictionary(reader, "Name"));创建的
我遇到的问题是(我假设)由于带状疱疹/n-gram 的工作方式,运行 _spellChecker.SuggestSimilar("Wiess") 的“Weiss”得分不会很高。 “Witness”、“Wireless”和“Wills”的得分高于“Weiss”。
似乎“Weiss”的得分应该高于“Wireless”。有没有办法可以调整它以获得这个结果?
【问题讨论】:
-
我认为这可能与拼写检查器使用的语言有关? (抱歉不知道lucene)
-
拼写检查器正在使用我提供的字词(名称),因此语言无关紧要。
标签: c# lucene lucene.net spell-checking