【发布时间】:2020-05-22 09:15:22
【问题描述】:
在 R 中,我有一个变量,其中包含每行的大字符串。从这些字符串中,我想提取特定部分,并将它们添加到我的数据框中的单独变量中。例如,一个字符串值如下所示:
"identification"":""138""city"":""New-York"":COMMENT""text"":""Very good!""COMMENT""text"":""It was delicious""guests"":""2""
想要的结果:
city comment_text_1 comment_text_2
1 New-York Very good! It was delicious!
每个字符串的长度不同,并且整个字符串都使用标点符号。此外,字符串之间存在一些细微差别,例如,city"":"" 和 COMMENT""text"":"" 之间可能还有一段文本
可能是一个开始,我需要的文本始终是 city"":"" 之后的文本,第一个 COMMENT""text"":"" 和第二个 COMMENT""text"":""。此外,我需要的文本总是以两个引号结尾""
【问题讨论】:
-
查看正则表达式教程。这很痛苦——祝你好运!