Jaccard相似度

杰卡德系数(Jaccard Index),也称Jaccard相似系数(Jaccard similarity coefficient),用于比较有限样本集之间的相似性与差异性。如集合间的相似性、字符串相似性、目标检测的相似性、文档查重等。
Jaccard系数的计算方式为:交集个数和并集个数的比值:

Jaccard相似度

相反地,Jaccard距离表示距离度量,用两个集合间不同样本比例来衡量:

Jaccard相似度

Jaccard相似度

相关文章: