【问题标题】:Where to find a reliable K-medoid(Not k-means) open source software/tool? [closed]在哪里可以找到可靠的 K-medoid(不是 k-means)开源软件/工具? [关闭]
【发布时间】:2011-12-01 19:06:08
【问题描述】:

我正在学习 K-medoids 算法,如果我问了不恰当的问题,我很抱歉。据我所知,K-medoids 算法实现了 K-means 聚类,但使用实际数据点作为质心而不是数学计算的平均值。

当我在网上搜索时,我发现了很多 k-means 工具,例如 GenePattern、geWengh 等,但没有发现 k-medoids 工具。一些好朋友向我展示了在 Matlab 中,也有一个用户编写的。但是,恐怕个人实现的工具可能仍然存在一些错误或限制。因此,我想知道是否有一些广泛使用的可靠开源软件/工具使用实际数据点作为质心进行聚类。我需要找出有关实际质心的信息,因此仅返回聚类结果是不够的。我更喜欢网站在线的,但如果不是这种情况,我可以将它安装到我的本地机器上。非常感谢,

【问题讨论】:

    标签: open-source cluster-analysis k-means


    【解决方案1】:
    1. C Clustering Library (source, Manual) 中提供了 C 中的 k-medoid 实现。 (注意,Cluster 3.0 是这个库的扩展,可能不提供 k-medoids)

      来自手册:

      在 C 聚类库中,提供了三种分区算法: • k 均值聚类 • k 中位数聚类 • k-medoids 聚类

    2. k-medoids in mlpy, Machine Learning library in Python

    3. k-medoids in Matlab

    4. k-medoids in Java

    5. k-medoids in C++

    【讨论】:

    • 感谢您的回复。据我所知,k-medians 与 k-medoids 不同。此外,Cluster 3.0 工具不会将质心作为原始数据点返回。如果我错了,请纠正我。关于其他程序和代码,它们很好。但是,由于它们是由个人编写的,而不是由 GenePattern 或 Cluster3.0 等实验室编写的,所以我有点担心它们的局限性。无论如何,如果没有其他解决方案,我会尝试使用个人的软件。
    • @Cassie ,C 聚类库是 Cluster 3.0 的前传,由同一页面中的同一作者提供。那里提供了 k-medoids(和 k-median)。另外,mlpy 不是个人写的。
    • R 库集群同时提供 k-means 和 k-medoids。
    • 我在 mlpy 中找不到任何 k-medoids。它消失了吗?还是有别的名字?
    【解决方案2】:

    软件:

    • ELKI 包括多种 k-means 变体,包括 K-medoids 和 PAM。
    • GNU R 包括 k-means 的“flexclust”包变体和“cluster”包。

    来源:http://en.wikipedia.org/wiki/K-medoids

    【讨论】:

      【解决方案3】:

      对于 Python,我找到了一个实现 PAM 和 Clara 的包:PyCluster

      【讨论】:

        猜你喜欢
        • 2017-03-21
        • 2019-03-02
        • 2014-03-04
        • 1970-01-01
        • 1970-01-01
        • 2010-11-11
        • 2011-03-30
        • 2019-08-29
        • 2021-09-19
        相关资源
        最近更新 更多