【问题标题】:K means clusteringK 表示聚类
【发布时间】:2017-05-02 05:41:31
【问题描述】:

在使用 K-means 聚类时,我删除了自变量的前 5 个和后 5 个百分位值,因此我丢失了几个数据点。 现在,在我使用 K-means 聚类之后,我得到了每个数据点的聚类。如何获取由于异常值而早先被删除的数据点的聚类

【问题讨论】:

    标签: k-means outliers


    【解决方案1】:

    只需执行带有异常值处理的整个 K 均值。一旦算法完成(在每次迭代中删除异常值),您可以将它们分配回最近的集群。这样,聚类均值不会改变,但异常值会得到合适的标签。

    【讨论】:

    • 嗨,请告诉我如何将它们分配回集群,因为我必须使用多个变量来计算距离。另外,我应该计算标准化值还是正常值的距离
    猜你喜欢
    • 2016-08-12
    • 2016-09-06
    • 2013-03-14
    • 2017-10-15
    • 2011-12-22
    • 2013-09-06
    • 2017-07-28
    相关资源
    最近更新 更多