【发布时间】:2018-02-17 05:37:08
【问题描述】:
我想在一个单独的新变量中索引 R 中某些变量的重复项。 假设我有以下数据集:
a <- seq(from=0, to=1, by=.4)
b <- seq(from=0, to=1, by=.4)
c <- seq(from=0, to=1, by=.4)
d <- seq(from=0, to=1, by=.4)
df <- expand.grid(a=a, b=b, c=c, d=d)
> df[1:20,]
a b c d
1 0.0 0.0 0.0 0
2 0.4 0.0 0.0 0
3 0.8 0.0 0.0 0
4 0.0 0.4 0.0 0
5 0.4 0.4 0.0 0
6 0.8 0.4 0.0 0
7 0.0 0.8 0.0 0
8 0.4 0.8 0.0 0
9 0.8 0.8 0.0 0
10 0.0 0.0 0.4 0
11 0.4 0.0 0.4 0
12 0.8 0.0 0.4 0
13 0.0 0.4 0.4 0
14 0.4 0.4 0.4 0
15 0.8 0.4 0.4 0
16 0.0 0.8 0.4 0
17 0.4 0.8 0.4 0
18 0.8 0.8 0.4 0
19 0.0 0.0 0.8 0
20 0.4 0.0 0.8 0
在这种情况下,第一个条目和第十个条目相对于 a 和 b 是相同的。我如何分配一个值,例如“0.00-0.00”为所有具有此组合的列(也是第 19 行)和所有其他组合(例如第 2、11 和 20 行等)的新变量。
提前非常感谢!
【问题讨论】:
标签: r if-statement indexing duplicates