【发布时间】:2023-04-08 19:08:01
【问题描述】:
我想为所有出现的模式提取两个字符串之间的文本。例如,我有这个字符串:
x<- "\nTYPE: School\nCITY: ATLANTA\n\n\nCITY: LAS VEGAS\n\n"
我想提取 ATLANTA 和 LAS VEGAS 这样的词:
[1] "ATLANTA" "LAS VEGAS"
我尝试使用gsub(".*CITY:\\s|\n","",x)。这产生的输出是:
[1] " LAS VEGAS"
我想同时输出两个城市(数据中的某些模式包括超过 2 个城市)并在没有前导空格的情况下输出它们。
我也尝试了 qdapRegex 包,但无法接近。我不太擅长正则表达式,因此非常感谢您的帮助。
【问题讨论】:
-
unlist(stringr::str_extract_all(x,"[A-Z]+(?=\\n)"))