【发布时间】:2020-03-25 21:57:40
【问题描述】:
假设我需要根据评论行中的句子为人们分配课程。 (实际数据比这个复杂,我简化了) 因此,我使用带有 remathces()、gsub() 和 gregexpr() 的正则表达式从数据中的注释句子中提取字符串。然后将列表保存到列并将它们组合为字符,如下所示。
>cbind.data.frame(level,software,month,stringsAsFactors = FALSE)
level software month
1 c("beginner1","beginner2") c++ Dec
2 NA Java Jan
3 "beginner3" NA May
4 "intermediate2" NA NA
5 NA Matlab Mar
6 "advanced1" c("java","c++") Jul
我想用
将所有字符分成一列-将列表 c("beginner1","beginner2") 分解为 "beginner1","beginner2"
-丢弃不适用
-保留为如下字符
newcol
"beginner1","beginner2","c++","Dec"
"Java","Jan"
"beginner3", "May"
"intermediate2"
"Matlab", "Mar"
"advanced1","java","c++","Jul"
但是,当我合并时,它被合并为一个字符。
> newcol<-unite(combined, newcol, 1:ncol(combined), remove=TRUE, sep = ",")
"beginner1,beginner2,c++,Dec"
"Java,Jan"
"beginner3, May"
"intermediate2"
"Matlab, Mar"
"advanced1,java,c++,Jul"
是否可以将多个字符作为分隔字符保存到一列中?
【问题讨论】: