【问题标题】:How to find and return matched value from a column of strings in R?如何从R中的一列字符串中查找并返回匹配值?
【发布时间】:2021-08-20 16:08:42
【问题描述】:

假设,第 1 列包含许多文件的目录(一堆文件夹和东西),总目录约为 10,000。第 2 列包含文件夹名称(有 20 个文件夹)。我想知道哪些目录来自第 2 列文件夹名称。我正在尝试获取一个返回匹配文件夹名称的代码,以便我知道哪个文件夹正在使用,哪些没有。我能够获得 TRUE 或 FALSE 返回,但我无法获得匹配值。

如果有人能给我一个指导,那就太好了。

【问题讨论】:

  • 请提供使用 dput() 的示例数据以及您迄今为止尝试过的内容(代码)
  • str_detect(test$ap_database,"New_Folder") 所有文件夹都以 New_Folder 开头。如“New_Folder_1, New_Folder_2...等等。我的想法是匹配20个文件夹名称与10,000行并找到匹配的文件夹和匹配文件夹的名称。我想找到我没有的文件夹完全被使用,这样我就可以摆脱那个文件夹。像第 1 列中没有使用“New_Folder_8”,那么我可以摆脱那个文件夹。

标签: r substring


【解决方案1】:

试试grep(pattern, x, value = TRUE)。提供一个最小的可重现示例是一个好主意。即,我们需要您正在处理的数据样本。

【讨论】:

  • 在 grep(pattern, x, value = TRUE) 上,模式只取 1 个值。我有一个需要匹配的值列表。假设第 5 行与 Folder_10 匹配,但第 7 行与 Folder_3 匹配。我想知道与哪个文件夹匹配。如果我没有看到 Folder_15 没有在任何行中使用,我将删除 Folder_15。
  • 将其放入 for 循环中,并循环遍历您希望匹配的每个文件夹名称。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-08-07
  • 1970-01-01
  • 2020-12-03
  • 2018-06-09
  • 2019-11-13
  • 2014-05-07
相关资源
最近更新 更多