【发布时间】:2018-01-05 01:36:09
【问题描述】:
我正在处理一些编码为a-b 的因子,还有一些编码为b-a。两者都为我的用例保存。如何将这些因素更改为 a-b 以使它们保持一致。
我可以使用if-else 语句来做到这一点,但我想知道是否有一种有效的方法来做到这一点。
来自
Id Col1
101 a-b-c-d
102 a-c-d
103 a-b
104 a-b
105 b-a
106 b-a
107 a-c-b
预期结果
Id Col1
101 a-b-c-d
102 a-c-d
103 a-b
104 a-b
105 a-b
106 a-b
107 a-c-b
【问题讨论】:
-
你有
a-c-b-d之类的案例吗?如果是一般情况,那么library(dplyr); df1 %>% separate_rows(Col1) %>% group_by(Id) %>% summarise(Col1 = paste(sort(Col1), collapse='-')) -
@akrun,是的,我还有其他因素
-
例如在上述情况下,您拥有
a-c-b。应该是a-b-c吗? -
@akrun,是的。没错
标签: r