【问题标题】:Cluster two features in Python在 Python 中聚类两个特征
【发布时间】:2017-05-15 23:02:13
【问题描述】:

我有两个稀疏的 scipy 矩阵,title and paragraph,其维度分别为 (284,183)(284,4195)。两个矩阵的每一行都是来自我的数据集一个实例的特征。我希望在没有预定义数量的集群的情况下对它们进行聚类,然后绘制它们。

我还有一个与每一行相关的数组Y(284,1)。一个类用 0 表示,另一个用 1 表示。我想用这个给点上色。如何使用 Python 做到这一点?

【问题讨论】:

    标签: python machine-learning scikit-learn cluster-analysis


    【解决方案1】:

    您可以使用skikit-learn Affinity propagation 或Mean-shift 库进行聚类。这些算法将输出一些集群和中心。使用Y 似乎是一个不同的问题,因为除非您导入一些其他库,否则您无法在 3D 平面上绘制多维点。

    【讨论】:

    • 如果这不是您不想要的,请发表评论,因为 atm 没有足够的声誉,我无法评论您的帖子。
    • Tesnorflow 是一个很好的多维点可视化库。或者您可以对点的平均距离使用树状图。
    • Y 只是两个类,用 1 或 0 表示。即。如果为 1,则为蓝色,如果为 0,则为红色。
    • 我的问题是你想让这个情节看起来像吗? @user7347576
    • 您要的答案是如何在 python 中进行集群。简单的答案是使用skikit-learn聚类均值偏移或类似'x = affinitypropagation(title)x.fit()'的Affinity传播库,它实际上就是这么简单,但这并不是你所需要的。这看起来就像我必须做的研究问题之一。我需要知道的是你得到了什么数据。我可以帮你解决这个问题,但这不是私人信息或其他东西的地方,因为你遇到的问题需要回答的不仅仅是一个答案.
    猜你喜欢
    • 2017-05-16
    • 2014-05-20
    • 2017-02-21
    • 2017-03-06
    • 2019-11-19
    • 2016-12-30
    • 2015-02-26
    • 2019-08-05
    • 1970-01-01
    相关资源
    最近更新 更多