【问题标题】:Clustering for mixed type of 2D data in RR中混合类型的2D数据的聚类
【发布时间】:2020-02-09 13:52:03
【问题描述】:

我有两个数据集,A 和 B。每个数据集都包含多个点的坐标。

现在我想对这两个数据集进行聚类分析。 我知道有很多用于 2D 数据的聚类方法,例如 R 包“largeVis”中的 hdbscan,以及 k-means 和 dbscan 算法。而且我也知道“gower”距离可用于混合一维数据帧。

但是,是否有任何类型的混合二维数据算法?我正在寻找 R 解决方案,但也对 Python 开放。

【问题讨论】:

    标签: python r cluster-analysis k-means dbscan


    【解决方案1】:

    您为什么认为 Gower 仅限于 1d 数据帧?

    什么是“混合一维”数据框?单个属性怎么混?

    大多数聚类算法在高维数据中都可以正常工作。只是在某些时候,您的距离函数会因维度灾难而崩溃。

    【讨论】:

    • 提到一维数据我的意思是数据框是1个数据的简单混合,例如:年龄、性别、薪水...等
    • 然而,这里提到二维数据,我指的是坐标,因为 x 和 y 坐标构成一个点。
    • 广义 DBSCAN 可以很容易地与两个距离测量一起使用。或者您只需定义自己的距离,例如,坐标上的 Haversine 和分类数据上的 Gower。但是你必须以某种方式选择权重。
    • 您好 Anony,感谢您的 cmets。有没有使用 DBSCAN 并应用于坐标数据的示例?
    • 是的,无处不在。这是最常见的用例。
    猜你喜欢
    • 2019-11-12
    • 1970-01-01
    • 2020-11-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-09-07
    • 1970-01-01
    • 2019-11-21
    相关资源
    最近更新 更多