【问题标题】:Get Distance of Point From Cluster Centroid on H2o KMEANS Clustering在 H2o KMEANS 聚类中获取点到聚类质心的距离
【发布时间】:2018-08-12 20:45:06
【问题描述】:

在 H2O KMeans 集群中。有没有办法计算数据集中每个点与集群质心的实际距离? 目前 H2o 为传递的数据提供预测的集群,但获取点与其集群质心的距离的最佳方法是什么。

我打算将此用于异常检测,其中远离质心的点被视为异常。我没有使用 Apache Spark,但打算使用 Sparking Water 进行尝试,但 H2o Api 似乎没有显示从集群质心获取每个点的距离的最佳方法。

【问题讨论】:

    标签: python k-means h2o anomaly-detection sparkling-water


    【解决方案1】:

    不幸的是,目前还没有一种方法可以通过 R 或 Python 执行此操作。 H2O 在Java 中有一个方法,但它从未在 R/Python 中公开过,所以我为那个here 添加了一张票。

    与此同时,您可以编写自定义代码来执行此操作,或者您可以使用深度学习自动编码器进行异常检测(此tutorial 中提供了示例)。

    【讨论】:

    • 嗨,艾琳。我目前使用的是 Apache Spark KMEANS,但我也在使用自动编码器,它给出了很好的结果,谢谢。
    猜你喜欢
    • 2016-06-11
    • 2015-02-27
    • 2016-11-16
    • 2018-09-30
    • 2020-05-03
    • 2018-09-16
    • 2011-05-22
    • 2013-07-28
    • 2012-04-02
    相关资源
    最近更新 更多