【问题标题】:How does spell checker and spell fixer of Google (or any search engine) work?Google(或任何搜索引擎)的拼写检查器和拼写修复器如何工作?
【发布时间】:2011-05-13 01:43:40
【问题描述】:

在 Google 中搜索某些内容时,如果您拼错了一个单词(可能是拼错了,也可能是您的意思是这个非字典单词),Google 会说: “显示......的结果,而不是搜索......”。

我试图弄清楚这将如何工作。 这基本上意味着能够找到与输入的非字典单词最接近的字典单词。它是如何工作的?我能猜到的一种方法是: 数数每个字符的实例,然后扫描字典以查找具有相同编号的单词。每个字符的实例数(仅具有 +-1 差异)。但这也会返回字谜。

是某种在这里有用的概率模型,例如马尔可夫等。我对马尔科夫的理解不够好,无法随意使用它,但只是一个非常疯狂的猜测。

有什么见解吗?

【问题讨论】:

标签: algorithm data-structures string search-engine


【解决方案1】:

您忘记了 google 提供的信息比您要多得多。他们会跟踪人们何时输入单词,不选择结果,然后不久再进行另一次搜索。然后,他们使用此信息为您建议更好的搜索。

请参阅How does the Google "Did you mean?" Algorithm work? 以获得更完整的解释。

请注意,当您认为 Google 实际上并没有进行拼写检查时,这种方法是有意义的。相反,他们正试图找出什么搜索词会给你你正在寻找的答案。显然,这和拼写检查之间有很多重叠,但这意味着他们并不总是试图纠正搜索,例如“Flickr”。

【讨论】:

    【解决方案2】:

    当您搜索与您之前执行的其他搜索相关的内容并获得更多结果时,谷歌会在它们上显示建议。 我们确信它不是拼写检查,而是显示其他人查询相关关键字的内容。

    【讨论】:

      猜你喜欢
      • 2011-10-14
      • 2010-09-25
      • 2013-07-03
      • 1970-01-01
      • 2013-03-27
      • 2011-08-17
      • 2012-05-30
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多