【发布时间】:2019-05-21 19:40:31
【问题描述】:
在 KDD99 数据集上执行 k-means 时,k 数的一般约定是什么?我读过的三篇不同的论文有三个完全不同的 k(25,20 和 5)。我想知道对此的一般看法,比如 k e.t.c 的范围应该是多少?
谢谢
【问题讨论】:
标签: machine-learning k-means anomaly-detection intrusion-detection
在 KDD99 数据集上执行 k-means 时,k 数的一般约定是什么?我读过的三篇不同的论文有三个完全不同的 k(25,20 和 5)。我想知道对此的一般看法,比如 k e.t.c 的范围应该是多少?
谢谢
【问题讨论】:
标签: machine-learning k-means anomaly-detection intrusion-detection
K-means 聚类算法用于查找数据中未明确标记的组。 我一般来说没有方法可以确定 K 的确切值,但可以使用估计的方法来确定它。
要找到 K,请取数据点与其聚类质心之间的平均距离。
肘部方法和核方法更精确,但集群的数量取决于您的问题。 (受到推崇的) 其中一种快速方法是:-取数据点数除以 2 的平方根,并将其设置为聚类数。
【讨论】: