【发布时间】:2014-08-23 16:43:40
【问题描述】:
我有两个具有“NA”值的不同大小的矩阵,并想找出常用术语之间的相关性。例如如果,
d1 =
[x] [y] [z]
a 1 6 11
b 2 NA 12
c 3 8 13
d 4 9 14
p+q 5 10 15
d2 =
[t] [u] [v] [x] [y]
p+a 20 16 12 8 4
b 19 15 11 7 3
c 18 14 10 6 2
a 17 13 9 5 1
行名也可能有一些特殊字符(例如 +)。我想对这两个矩阵进行子集化,使它们只有共同的行和列,没有 NA,例如,
d1 <-
[x] [y]
[a] 1 6
[c] 3 8
d2 <-
[x] [y]
[a] 5 1
[c] 6 2
我可以执行 cor(d1,d2)。我对使用 cor 的 use 或 na.rm 选项不感兴趣
实际上,真正的数据在成千上万的行和列中。我厌倦了 complete.cases 和 is.na 来查找并删除 NA 。然后我尝试%in% 过滤行和列,但我得到 NA 或 NaN 作为最终答案。
非常感谢您的帮助。谢谢。
【问题讨论】:
标签: r matrix correlation subset