【问题标题】:What's the relationship between Hamming distance and Simple Matching Coefficient?汉明距离和简单匹配系数有什么关系?
【发布时间】:2016-05-30 14:10:54
【问题描述】:

我正在做Introduction to Data Mining的练习,并陷入以下问题:

Jaccard 或 Hamming 距离哪种方法更类似于 简单匹配系数,哪种方法更类似于 余弦测量?解释。 (注意:汉明度量是距离, 虽然其他三个措施是相似的,但不要让这混淆 你。)

我认为汉明距离类似于 SMC,因为它们都查看整个数据集并比较相似或不同的数据点。但本书的解决方法如下:

汉明距离类似于 SMC。事实上,SMC = Hamming 距离/位数。

解决方案是否出错?我认为汉明距离和SMC不相等,汉明距离加SMC等于1。

【问题讨论】:

    标签: data-mining similarity hamming-distance


    【解决方案1】:

    汉明/长度 = 1 - SMC

    是一个非常强的关系。因此,它们的功能等效

    你“查看整个数据集”的说法是错误的,每个都是在一对对象上定义的?

    本练习的重点是练习您的基本数学技能,并将方程式相互转换。这是您经常需要的技能:

    1. 等价功能不用探索,一个就够了
    2. 等效函数中,一个可能比另一个计算效率更高
    3. 的等效函数中,由于浮点数学,一个可能比另一个更精确。

    【讨论】:

    • 感谢您的清晰解释!这对我很有帮助!
    猜你喜欢
    • 2012-03-10
    • 2015-07-21
    • 2015-03-21
    • 2017-09-10
    • 1970-01-01
    • 2014-01-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多