【发布时间】:2013-08-05 08:35:40
【问题描述】:
我有一个仅包含“a”或“g”的字符向量,我想根据频率将它们转换为整数,例如,更频繁的一个应该编码为 0,另一个编码为 1 :
set.seed(17)
x = sample(c('g', 'a'), 10, replace=T)
x
# [1] "g" "a" "g" "a" "g" "a" "g" "g" "a" "g"
x[x == names(which.max(table(x)))] = 0
x[x != 0] = 1
x
# [1] "0" "1" "0" "1" "0" "1" "0" "0" "1" "0"
这可行,但我想知道是否有更有效的方法。
(我们不必在这里考虑 50%-50% 的情况,因为它不应该在我们的研究中发生。)
【问题讨论】:
标签: r data-manipulation