【发布时间】:2015-08-26 08:34:56
【问题描述】:
在 R 中,我有一个包含两个测量值 red 和 green 的 data.table,并且想计算它们的累积相关性。
library(data.table)
DT <- data.table(red = c(1, 2, 3, 4, 5, 6.5, 7.6, 8.7),
green = c(2, 4, 6, 8, 10, 12, 14, 16),
id = 1:8)
如何在一个 data.table 命令中获得以下输出?
...
> DT[1:5, cor(red, green)]
[1] 1 # should go into row 5
> DT[1:6, cor(red, green)]
[1] 0.9970501 # should go into row 6, and so on ...
> DT[1:7, cor(red, green)]
[1] 0.9976889
编辑: 我知道它可以通过循环来解决,但是我的 data.table 有大约 100 万行分组为较小的块,所以循环相当慢,我认为可能还有其他可能性。
【问题讨论】:
-
data.table 有多大?
标签: r data.table