【发布时间】:2018-07-31 23:56:34
【问题描述】:
我得到的结果是fuzzywuzzy,效果不如预期。如果中间有多余的单词,由于levenshtein的不同,分数会更低。
例子:
from fuzzywuzzy import fuzz
score = fuzz.ratio('DANIEL CARTWRIGHT', 'DANIEL WILLIAM CARTWRIGHT')
print(score)
score = fuzz.ratio('DANIEL CARTWRIGHT', 'DAVID CARTWRIGHT')
print(score)
score = fuzz.partial_ratio('DANIEL CARTWRIGHT', 'DANIEL WILLIAM CARTWRIGHT')
print(score)
score = fuzz.partial_ratio('DANIEL CARTWRIGHT', 'DAVID CARTWRIGHT')
print(score)
结果: 81 85 71 81
我希望第一对(丹尼尔对丹尼尔威廉)比第二对(丹尼尔对大卫)更好。
有没有比fuzzywuzzy更好的方法在这里使用?
【问题讨论】:
标签: python fuzzy-search fuzzywuzzy