【发布时间】:2018-03-09 21:57:09
【问题描述】:
使用 ClusterR 进行聚类的初始化方法的文档非常神秘。你能发布一篇描述optimal_init方法的论文的参考吗?
这是官方所说的:
optimal_init:此初始化程序以增量方式添加数据行,同时检查它们是否已存在于质心矩阵中
【问题讨论】:
-
也许对check source code有帮助。
标签: r cluster-analysis
使用 ClusterR 进行聚类的初始化方法的文档非常神秘。你能发布一篇描述optimal_init方法的论文的参考吗?
这是官方所说的:
optimal_init:此初始化程序以增量方式添加数据行,同时检查它们是否已存在于质心矩阵中
【问题讨论】:
标签: r cluster-analysis
ClusterR包的KMeans_rcpp和MiniBatchKmeans中使用的初始化器是:
我在包中添加了最后两个(quantile_init 和 optimal_init),因为我在对各种数据集进行测试后发现它们给出了相似(或更好)的结果(使用验证指标)和/或运行得更快。它们都是实验性的,并且(你是对的)在包的下一个版本中我将在文档详细信息中添加注释。可以看到quantile_init的rcpp代码和 optimal_init 在包存储库中。
【讨论】: