【发布时间】:2016-05-30 14:10:54
【问题描述】:
我正在做Introduction to Data Mining的练习,并陷入以下问题:
Jaccard 或 Hamming 距离哪种方法更类似于 简单匹配系数,哪种方法更类似于 余弦测量?解释。 (注意:汉明度量是距离, 虽然其他三个措施是相似的,但不要让这混淆 你。)
我认为汉明距离类似于 SMC,因为它们都查看整个数据集并比较相似或不同的数据点。但本书的解决方法如下:
汉明距离类似于 SMC。事实上,SMC = Hamming 距离/位数。
解决方案是否出错?我认为汉明距离和SMC不相等,汉明距离加SMC等于1。
【问题讨论】:
标签: data-mining similarity hamming-distance