【问题标题】:Extracting text in R在 R 中提取文本
【发布时间】:2013-03-26 06:36:13
【问题描述】:

我正在尝试使用 R 提取可变长度的文本子字符串。我有几个字符,如下所示:

"\"/Users/Nel/Documents/Project/Data/dataset.csv\""

我需要从每个这样的字符中提取文件路径。在这种情况下,我想要得到的是:

path1 <- "/Users/Nel/Documents/Project/Data/dataset.csv"

我可以使用 substring 函数:

path1 <- substr("\"/Users/Nel/Documents/Project/Data/dataset.csv\"", 3, 46)

使用硬编码的索引来获得我在这个特定实例中想要的内容。但是,这条特定的路径是众多路径之一,我需要能够即时找到这些索引。我相信

grep()

函数可以工作,但我无法弄清楚相关的正则表达式。谢谢。

【问题讨论】:

    标签: regex r text extract substr


    【解决方案1】:

    您似乎只是想删除一些硬编码的引号。

    试试gsub:

    x
    # [1] "\"/Users/Nel/Documents/Project/Data/dataset.csv\""
    gsub('\"',"",x)
    # [1] "/Users/Nel/Documents/Project/Data/dataset.csv"
    ## or 
    # gsub('["]', "", x)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-05-11
      • 2016-08-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-05-06
      • 1970-01-01
      • 2019-04-28
      相关资源
      最近更新 更多