【发布时间】:2018-10-17 18:25:47
【问题描述】:
限制究竟是如何与pythonsfuzzywuzzy模块一起工作的,是什么意思?
matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)
【问题讨论】:
标签: python-3.x fuzzy-logic fuzzy fuzzywuzzy
限制究竟是如何与pythonsfuzzywuzzy模块一起工作的,是什么意思?
matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)
【问题讨论】:
标签: python-3.x fuzzy-logic fuzzy fuzzywuzzy
limit一般用在fuzzywuzzy中,当你需要“x”个最佳匹配解时。
因此,例如,您正在比较 df 的同一列以相互匹配。第一场比赛将是名称本身。所以,limit = 2 确实获得了第二好的匹配。
Ex: column values =['Apple','Banana','Orange','Appl','Banan']
如果您想使用同一列进行模糊处理,并查看由于拼写错误等原因在不同上下文中如何使用“Apple”。现在 Apple 的最佳匹配将是 Apple 本身,所以您可以使用 limit=2 获取“Appl" 在这种情况下
希望我清楚
【讨论】: