【发布时间】:2013-01-08 15:51:27
【问题描述】:
我正在使用均值偏移,此过程计算数据集中每个点的收敛位置。我还可以计算两个不同点收敛的坐标之间的欧几里得距离,但我必须给出一个阈值,也就是说,如果(距离
如何找到用作阈值的正确值??
(我可以使用每一个值,并且取决于结果,但我需要最优值)
【问题讨论】:
-
请在以后谨慎选择您的标签:放置错误的标签很可能会导致您的问题对可能知道如何回答的人不可见。
-
你有没有想过使用药盒内核:它具有更好的收敛性。
-
药盒内核?我不知道它是什么...但是我的问题与收敛属性无关,我只需设置适当的阈值即可将点合并到集群中,只是我不知道如何选择最佳值!(是k-means 中 k 的一种选择)
-
在均值漂移聚类中,每个聚类在诱导密度中表示为不同的“吸引盆地”。如果附近的数据点收敛到密度函数的不同模式,那么你的内核不够平滑:你有太多的本地模式。您需要一个更本地化和更流畅的内核。一个这样的内核是有限支持统一内核(又名药盒内核)。
-
我有 3d 点,所以,如果一个点收敛到 (11.345,23.896, 87.52) 而另一个点收敛到 (11.789,23.24,87.25),它们不属于同一个集群,问题是我的内核不够平滑?(那么重点必须完全相同,对吗?)很高兴知道...我在哪里可以找到有关此药盒内核的一些示例?
标签: cluster-analysis threshold kernel-density