【问题标题】:Regex: Match first two digits of a four digit number正则表达式:匹配四位数字的前两位数字
【发布时间】:2021-10-14 14:47:53
【问题描述】:

我有:

'30Jun2021'

我想跳过/删除四位数的前两位数字(或任何其他方式):

'30Jun21'

我试过了:

^.{0,5}

https://regex101.com/r/hAJcdE/1

我有前 5 个字符,但我还没有弄清楚如何跳过/删除“20”

【问题讨论】:

    标签: r string datetime


    【解决方案1】:

    你甚至不需要正则表达式。只需使用子字符串操作:

    x <- '30Jun2021'
    paste0(substr(x, 1, 5), substr(x, 8, 9))
    
    [1] "30Jun21"
    

    【讨论】:

      【解决方案2】:

      使用专用的日期/时间函数更好地处理日期时间。

      您可以将变量转换为日期并使用format 来获取任何格式的输出。

      x <- '30Jun2021'
      format(as.Date(x, '%d%b%Y'), '%d%b%y')
      #[1] "30Jun21"
      

      您还可以使用lubridate::dmy(x)x 转换为日期。

      【讨论】:

        【解决方案3】:

        您还可以将字符串的格式与 2 个捕获组匹配,在其中匹配要省略的部分并捕获要保留的部分。

        \b(\d+[A-Z][a-z]+)\d\d(\d\d)\b
        

        Regex demo

        sub("\\b(\\d+[A-Z][a-z]+)\\d\\d(\\d\\d)\\b", "\\1\\2", "30Jun2021")
        

        输出

        [1] "30Jun21"
        

        【讨论】:

          【解决方案4】:

          使用sub

           sub('\\d{2}(\\d{2})$', "\\1", x)
          [1] "30Jun21"
          

          str_remove

          library(stringr)
          str_remove(x, "\\d{2}(?=\\d{2}$)")
          [1] "30Jun21"
          

          数据

          x <- '30Jun2021'
          

          【讨论】:

            猜你喜欢
            • 2021-05-02
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 2021-11-10
            • 1970-01-01
            相关资源
            最近更新 更多