使用 k-means 确定 kdd99 数据集的聚类数

【问题标题】：Determining the number of clusters for kdd99 dataset using k-means使用 k-means 确定 kdd99 数据集的聚类数
【发布时间】：2019-05-21 19:40:31
【问题描述】：

在 KDD99 数据集上执行 k-means 时，k 数的一般约定是什么？我读过的三篇不同的论文有三个完全不同的 k（25,20 和 5）。我想知道对此的一般看法，比如 k e.t.c 的范围应该是多少？

谢谢

【问题讨论】：

标签： machine-learning k-means anomaly-detection intrusion-detection

【解决方案1】：

K-means 聚类算法用于查找数据中未明确标记的组。我一般来说没有方法可以确定 K 的确切值，但可以使用估计的方法来确定它。

要找到 K，请取数据点与其聚类质心之间的平均距离。
肘部方法和核方法更精确，但集群的数量取决于您的问题。（受到推崇的）其中一种快速方法是：-取数据点数除以 2 的平方根，并将其设置为聚类数。

【讨论】：

猜你喜欢

2018-04-22
2013-02-28
2010-12-20

相关资源

下载 2021-06-24
下载 2023-04-04
下载 2023-03-07
下载 2023-02-24

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode