【问题标题】:Determining the number of clusters for kdd99 dataset using k-means使用 k-means 确定 kdd99 数据集的聚类数
【发布时间】:2019-05-21 19:40:31
【问题描述】:

在 KDD99 数据集上执行 k-means 时,k 数的一般约定是什么?我读过的三篇不同的论文有三个完全不同的 k(25,20 和 5)。我想知道对此的一般看法,比如 k e.t.c 的范围应该是多少?

谢谢

【问题讨论】:

    标签: machine-learning k-means anomaly-detection intrusion-detection


    【解决方案1】:

    K-means 聚类算法用于查找数据中未明确标记的组。 我一般来说没有方法可以确定 K 的确切值,但可以使用估计的方法来确定它。

    1. 要找到 K,请取数据点与其聚类质心之间的平均距离。

    2. 肘部方法和核方法更精确,但集群的数量取决于您的问题。 (受到推崇的) 其中一种快速方法是:-取数据点数除以 2 的平方根,并将其设置为聚类数。

    【讨论】:

      猜你喜欢
      • 2018-04-22
      • 2013-02-28
      • 2010-12-20
      相关资源
      最近更新 更多