【发布时间】:2023-03-31 18:47:01
【问题描述】:
我有一个问题,我们可以通过将 e.d 值除以两个字符串的长度来标准化 levenshtein 编辑距离吗? 我问这个是因为,如果我们比较两个长度不等的字符串,那么两者长度之间的差异也会被计算在内。 例如: ed('has a', '有一个球') = 4 和 ed('has a', '有一个球是圆形的') = 15。 如果我们增加字符串的长度,即使它们相似,编辑距离也会增加。 因此,我无法设置一个值,一个好的编辑距离值应该是多少。
【问题讨论】:
标签: algorithm string-matching ranking levenshtein-distance edit-distance