【问题标题】:Is there any lucene/solr spell checker which can handle space insertions/removal typos?是否有任何可以处理空间插入/删除拼写错误的 lucene/solr 拼写检查器?
【发布时间】:2012-03-08 16:14:47
【问题描述】:

据我所知,几乎所有都基于单个查询词进行拼写检查,并且无法对整个输入查询进行更改以增加 corpra 的覆盖率。我在 lingpipe 有一个,但是很贵...http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html

所以我的问题是,拼写检查器之类的 lingpipe 的最佳 Apache 替代品是什么?

【问题讨论】:

    标签: solr lucene spell-checking


    【解决方案1】:

    lucene 中的拼写检查器将空格视为任何其他字符。因此,一般而言,您可以向他们提供您的查询日志或其他内容,以及拼写检查/自动完成完整查询。

    对于 lucene,这应该可以正常工作,对于 solr,您需要确保 QueryConverter 不会拆分您的条款...请参阅 https://issues.apache.org/jira/browse/SOLR-3143

    另一方面,这些建议器目前处理整个输入,因此,如果您想建议以前从未搜索过的查询,那么您需要一些可能只包含上下文的最后 N 个单词的内容,类似于 http://googleblog.blogspot.com/2011/04/more-predictions-in-autocomplete.html .

    我希望我们很快也会提供这种风格的建议者作为替代方案,可能在https://issues.apache.org/jira/browse/LUCENE-3842 下。

    但请记住,这并不适合所有用途,所以我认为它可能只是一种选择。例如,如果您从事电子商务,那么建议您不销售的产品是没有意义的:)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2015-04-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-12-27
      • 2014-07-15
      相关资源
      最近更新 更多