【发布时间】:2011-05-13 01:43:40
【问题描述】:
在 Google 中搜索某些内容时,如果您拼错了一个单词(可能是拼错了,也可能是您的意思是这个非字典单词),Google 会说: “显示......的结果,而不是搜索......”。
我试图弄清楚这将如何工作。 这基本上意味着能够找到与输入的非字典单词最接近的字典单词。它是如何工作的?我能猜到的一种方法是: 数数每个字符的实例,然后扫描字典以查找具有相同编号的单词。每个字符的实例数(仅具有 +-1 差异)。但这也会返回字谜。
是某种在这里有用的概率模型,例如马尔可夫等。我对马尔科夫的理解不够好,无法随意使用它,但只是一个非常疯狂的猜测。
有什么见解吗?
【问题讨论】:
标签: algorithm data-structures string search-engine