【发布时间】:2019-11-23 20:32:20
【问题描述】:
我有一个字符串要与候选人列表进行匹配。这是一个例子:
# ignore case
string = "The Shining" # The Stanley Kubrick Movie
candidates = ['Shining', 'The shins', 'Shining, The']
most_similar(string, candidates)
==> 'Shining, The'
做一个“文字字符串比较”,在这种情况下,我通常使用Levenshtein distance 或比率。但是,我想做一个更复杂的相似性测试,以便上述情况下的最佳匹配是Shining, The。
我猜这是一个可能已经广泛解决的常见问题,所以我想知道什么库/工具/等。可能是获得我想要做的事情的最佳方式?
【问题讨论】:
标签: python python-3.x string search levenshtein-distance