【发布时间】:2014-03-12 09:26:27
【问题描述】:
我目前正在编写一个自定义函数来实现这一点,但我想知道 R 中是否有一个简单的内置函数可以实现相同的目标。
我有如下数据:
stringVariable1 stringVariable2
string1 a
string1 b
string1 d
string2 e
string2 a
string3 b
我想对 stringVariable2 中的数据进行洗牌,但我不希望 1 中的不同 stringVariables 出现重复。
所以这是不可接受的(因为 'b' 相对于 string1 是重复的):
stringVariable1 stringVariable2
string1 b
string1 b
string1 d
string2 a
string2 e
string3 d
但这会:
stringVariable1 stringVariable2
string1 b
string1 e
string1 d
string2 a
string2 e
string3 d
所以基本上我试图随机化 stringVariable2,而不是替换不同的 stringVariable1。创建自定义函数是唯一的方法吗?
谢谢!
【问题讨论】:
-
取决于性能...例如,您可以洗牌 var2,检查重复项,并在需要时重新洗牌
-
我考虑过,但是数据有超过100万行有很多重复的字符串变量,所以至少得到一个重复的概率超过99%
-
(我想运行大约 10000 次)
标签: r sampling random-sample