【问题标题】:Subseting data from data frame columns that match key words对匹配关键字的数据框列中的数据进行子集化
【发布时间】:2023-03-12 00:48:01
【问题描述】:

我有一个包含 30 列的数据框,其中一个列变量是人物标题。这些不遵循任何组或结构,因为许多标题都是独一无二的,但是我想选择其中包含某些单词的所有标题,例如“领导者”或“综合”。

我尝试过使用以下 select dplyr 函数:

df1<-select(df, Title, contains('digital'))

然而这并没有奏效。有什么想法吗?

【问题讨论】:

  • 试试df[grep("\\b(leader|integrated)\\b", df$Title),] 尚不清楚您是对行还是列进行子集化。 select 方法用于对列进行子集化,但从描述看来,您似乎想根据“标题”列中的某些字符串对行进行子集化。给出一个可重复的小例子以及预期的输出不会有什么坏处。
  • 首先子集您所需的列(选择用于列)。然后在子集中查找,这里以stackoverflow.com/questions/20782218/…为例

标签: r filter dplyr subset


【解决方案1】:

我想你想像这个例子一样使用filtergrepl

iris %>% filter( grepl( "set" , Species))

这里,Species 是我匹配“设置”到的列。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-08-15
    • 2015-04-24
    • 2015-02-04
    • 2014-03-16
    • 2013-01-02
    • 2022-12-14
    • 1970-01-01
    相关资源
    最近更新 更多