【发布时间】:2017-11-18 16:58:00
【问题描述】:
我有一个大数据框(以下只是一个示例):
我想随机选择(概率为 50%)X1 或 X2 的值。
> df = data.frame(matrix(rnorm(20), nrow=7))
> df
X1 X2
1 0.7091409 -1.4061361
2 -1.1334614 -0.1973846
3 2.3343391 -0.4385071
4 -0.9040278 -0.6593677
5 0.4180331 -1.2592415
6 0.7572246 -0.5463655
7 -0.8996483 0.4231117
我想从 X1 或 X2 中随机选择一个并将其添加为新列。
结果应该是这样的:
> df
X1 X2 RC
1 0.7091409 -1.4061361 -1.4061361
2 -1.1334614 -0.1973846 -1.1334614
3 2.3343391 -0.4385071 -0.4385071
4 -0.9040278 -0.6593677 -0.6593677
5 0.4180331 -1.2592415 0.4180331
6 0.7572246 -0.5463655 0.7572246
7 -0.8996483 0.4231117 0.4231117
对于大数据数据框,最有效的方法是什么?
【问题讨论】:
标签: r dataframe random bigdata