【发布时间】:2017-05-02 05:41:31
【问题描述】:
在使用 K-means 聚类时,我删除了自变量的前 5 个和后 5 个百分位值,因此我丢失了几个数据点。 现在,在我使用 K-means 聚类之后,我得到了每个数据点的聚类。如何获取由于异常值而早先被删除的数据点的聚类
【问题讨论】:
在使用 K-means 聚类时,我删除了自变量的前 5 个和后 5 个百分位值,因此我丢失了几个数据点。 现在,在我使用 K-means 聚类之后,我得到了每个数据点的聚类。如何获取由于异常值而早先被删除的数据点的聚类
【问题讨论】:
只需执行带有异常值处理的整个 K 均值。一旦算法完成(在每次迭代中删除异常值),您可以将它们分配回最近的集群。这样,聚类均值不会改变,但异常值会得到合适的标签。
【讨论】: