【发布时间】:2013-09-30 08:29:50
【问题描述】:
我使用 google-diff-match-patch C# 库。我想测量两个文本之间的相似性。 为此,我编写了这个 C# 代码:
List<DiffMatchPatch.Diff> lDiffs = dmpDiff.diff_main(sTexte1, sTexte2);
int iIndex = dmpDiff.diff_levenshtein(lDiffs);
double dsimilarity = 100 - ((double)iIndex / Math.Max(sTexte1.Length, sTexte2.Length) * 100);
相似度值介于 0 - 100 之间(0 == 完美匹配 - 100 == 完全不同)。
你认为这是一个好方法吗,这个计算是否正确?
【问题讨论】:
标签: c# string similarity