【发布时间】:2021-06-22 17:33:24
【问题描述】:
是否有一种 KPrototypes 聚类技术可以限制聚类的大小?
例如,在我当前的集群中,我得到 4 个集群,其中一个集群包含 50% 的样本总体。我想知道是否已经存在某些东西可以让我将任何集群限制为不超过样本的 30%,并强制超过 30% 的其他数据点成为其他集群的一部分?
【问题讨论】:
标签: machine-learning cluster-analysis
是否有一种 KPrototypes 聚类技术可以限制聚类的大小?
例如,在我当前的集群中,我得到 4 个集群,其中一个集群包含 50% 的样本总体。我想知道是否已经存在某些东西可以让我将任何集群限制为不超过样本的 30%,并强制超过 30% 的其他数据点成为其他集群的一部分?
【问题讨论】:
标签: machine-learning cluster-analysis
这是一个有趣的问题。我首先承认我不知道你的问题是否有绝对正确的答案。我猜想,因为聚类是无监督的,所以你真的对结果没有太多的控制权。您当然可以控制聚类的数量,并且一些聚类技术会为您选择最佳的聚类数量,因此您不必做出此决定,但您的问题不同,对吧。我有兴趣看看其他人对此有何看法。同时,请查看下面的链接以获取有关集群的大量信息。
【讨论】: