【发布时间】:2022-01-19 23:05:38
【问题描述】:
我有一个连接文本字段的示例(请参阅下面的示例数据),它是从两个或三个不同的字段创建的,但是不能保证单词的顺序是相同的。我想创建一个新的数据集,其中包含相同单词的字段,无论顺序如何,都会被折叠。但是,由于我事先不知道哪些单词将被连接在一起,因此代码必须识别出两个字符串中的所有单词都匹配。
示例数据代码:
var1<-c("BLUE|RED","RED|BLUE","WHITE|BLACK|ORANGE","BLACK|WHITE|ORANGE")
freq<-c(1,1,1,1)
have<-as.data.frame(cbind(var1,freq))
有:
var1 freq
BLUE|RED 1
RED|BLUE 1
WHITE|BLACK|ORANGE 1
BLACK|WHITE|ORANGE 1
如何将数据折叠成我想要的下面?
color freq
BLUE|RED 2
WHITE|BLACK|ORANGE 2
【问题讨论】: