【发布时间】:2018-08-12 20:45:06
【问题描述】:
在 H2O KMeans 集群中。有没有办法计算数据集中每个点与集群质心的实际距离? 目前 H2o 为传递的数据提供预测的集群,但获取点与其集群质心的距离的最佳方法是什么。
我打算将此用于异常检测,其中远离质心的点被视为异常。我没有使用 Apache Spark,但打算使用 Sparking Water 进行尝试,但 H2o Api 似乎没有显示从集群质心获取每个点的距离的最佳方法。
【问题讨论】:
标签: python k-means h2o anomaly-detection sparkling-water