【发布时间】:2020-11-28 08:53:24
【问题描述】:
我目前有一个类似下面一堆成对相关性的数据框:
数据
structure(list(ID1 = c("A", "A", "A", "B", "B", "C"), ID2 = c("B",
"C", "D", "C", "D", "D"), cor = c(0.6, 0.6, 0.2, 0.1, 0.9, 0.2
), value1 = c(50L, 50L, 50L, 20L, 20L, 30L), value2 = c(20L,
30L, 100L, 30L, 100L, 100L)), class = "data.frame", row.names = c(NA,
-6L))
ID1 ID2 cor value1 value2
1 A B 0.6 50 20
2 A C 0.6 50 30
3 A D 0.2 50 100
4 B C 0.1 20 30
5 B D 0.9 20 100
6 C D 0.2 30 100
我正在尝试获取 cor 与 value1 或 value2 之间产品的所有 ID(即 B)的总和,具体取决于它来自 ID1 还是 ID2。
例如,B 的总和将是(cor x 值)
(0.6 x 50) + (0.1 x 30) + (0.9 x 100)
我基本上需要为大约 20000 个唯一 ID 执行此操作。我希望这是有道理的。我在 R 方面还不是很好(还)!
【问题讨论】:
-
当
B在ID2中时,为什么cor与value1相乘?这不直观。
标签: r