【发布时间】:2014-05-05 12:11:49
【问题描述】:
如何使用 mahout 计算 k-means 聚类中的成本函数值?
我正在上 Coursera 的机器学习课程。并且有人建议如果我们在 k-means 聚类期间随机初始化聚类,为了计算聚类,我们应该使用不同的初始聚类质心值多次进行。然后我们应该检查成本函数的值,看看哪个迭代成本最小。
您能否建议在 Apache mahout 的 k-means 集群实现中如何计算成本值?
【问题讨论】:
如何使用 mahout 计算 k-means 聚类中的成本函数值?
我正在上 Coursera 的机器学习课程。并且有人建议如果我们在 k-means 聚类期间随机初始化聚类,为了计算聚类,我们应该使用不同的初始聚类质心值多次进行。然后我们应该检查成本函数的值,看看哪个迭代成本最小。
您能否建议在 Apache mahout 的 k-means 集群实现中如何计算成本值?
【问题讨论】:
它独立于实现。只需计算从点到各自质心的距离平方和。这是您的成本函数。
【讨论】: