【发布时间】:2021-10-14 14:47:53
【问题描述】:
我有:
'30Jun2021'
我想跳过/删除四位数的前两位数字(或任何其他方式):
'30Jun21'
我试过了:
^.{0,5}
https://regex101.com/r/hAJcdE/1
我有前 5 个字符,但我还没有弄清楚如何跳过/删除“20”
【问题讨论】:
我有:
'30Jun2021'
我想跳过/删除四位数的前两位数字(或任何其他方式):
'30Jun21'
我试过了:
^.{0,5}
https://regex101.com/r/hAJcdE/1
我有前 5 个字符,但我还没有弄清楚如何跳过/删除“20”
【问题讨论】:
你甚至不需要正则表达式。只需使用子字符串操作:
x <- '30Jun2021'
paste0(substr(x, 1, 5), substr(x, 8, 9))
[1] "30Jun21"
【讨论】:
使用专用的日期/时间函数更好地处理日期时间。
您可以将变量转换为日期并使用format 来获取任何格式的输出。
x <- '30Jun2021'
format(as.Date(x, '%d%b%Y'), '%d%b%y')
#[1] "30Jun21"
您还可以使用lubridate::dmy(x) 将x 转换为日期。
【讨论】:
您还可以将字符串的格式与 2 个捕获组匹配,在其中匹配要省略的部分并捕获要保留的部分。
\b(\d+[A-Z][a-z]+)\d\d(\d\d)\b
sub("\\b(\\d+[A-Z][a-z]+)\\d\\d(\\d\\d)\\b", "\\1\\2", "30Jun2021")
输出
[1] "30Jun21"
【讨论】:
使用sub
sub('\\d{2}(\\d{2})$', "\\1", x)
[1] "30Jun21"
或str_remove
library(stringr)
str_remove(x, "\\d{2}(?=\\d{2}$)")
[1] "30Jun21"
x <- '30Jun2021'
【讨论】: