【发布时间】:2015-10-17 00:56:42
【问题描述】:
我想知道你的字符串是否几乎相似。例如,像“Mohan Mehta”这样的字符串应该匹配“Mohan Mehte”,反之亦然。另一个例子,像“Umesh Gupta”这样的字符串应该匹配“Umash Gupte”。
基本上一个字符串是正确的,另一个是拼写错误。我所有的字符串都是人名。
关于如何实现这一点的任何建议。
解决方案不必 100% 有效。
【问题讨论】:
-
这似乎是编辑距离的问题。最少的编辑意味着更好的匹配。
-
看看正则表达式模块和模糊匹配:pypi.python.org/pypi/regex
-
你可以看看“Levenshtein distance”算法。