【问题标题】:assign cluster labels to data using a cluster assignment matrix使用集群分配矩阵将集群标签分配给数据
【发布时间】:2016-06-07 18:16:34
【问题描述】:

您好,我正在使用 R 并且有一个来自我的聚类函数的聚类分配矩阵。 (我正在对高斯混合数据应用聚类算法)我想创建一个聚类数据矩阵。这是我想做的一个玩具示例。

#simulate data

dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
 dat
 [1] -0.5350681  1.0444655  2.9229136  8.2528266 -0.7561170 -1.0240702     -1.0012780
 [8] -0.1322981  7.8525855  2.2278264

# Making up a cluster assignment matrix (actually this one comes out of my      
#clustering function

amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
        amat
       [,1] [,2]
 [1,]    1    0
 [2,]    1    0
 [3,]    0    1
 [4,]    0    1
 [5,]    1    0
 [6,]    1    0
 [7,]    1    0
 [8,]    0    1
 [9,]    0    1
[10,]    0    1

我想使用上面给出的分配矩阵创建名为(比如说)“clust”的数据框或向量,其中包含如下的集群标签。基本上它使用分配矩阵的第一列和第二列,并将标签 1 分配给来自正常的数据分布 N(0,1) 并将标签 2 分配给来自正态分布 N(2,3) 的数据。感谢任何帮助。提前致谢。

    # clust should look like this (I have no idea how to create this using amat and dat)

    clust
 [1] 1 1 2 2 1 1 1 2 2 2

【问题讨论】:

    标签: r machine-learning cluster-analysis


    【解决方案1】:

    这不是本质吗

    1 * column1 + 2 * column2 +3 * column3 等等?

    这应该直接写成一个矩阵乘法,包含 [1,2,3,4,...] 和求和运算。

    【讨论】:

      【解决方案2】:

      向量已经是二进制的。我们可以在第二列添加1L

      clust <- amat[,2] + 1L
      [1] 1 1 2 2 1 1 1 2 2 2
      

      (后缀 L 将值强制转换为 integer

      【讨论】:

      • 我的实际分配矩阵是更高维的。其中之一是 3 维的。我还有另一个 9 维的分配矩阵。我一般如何将上述方法用于任何维度分配矩阵?
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-11-12
      • 1970-01-01
      • 2015-05-15
      • 2018-09-26
      • 1970-01-01
      • 2014-07-29
      • 2015-01-10
      相关资源
      最近更新 更多