对匹配关键字的数据框列中的数据进行子集化答案

【问题标题】：Subseting data from data frame columns that match key words对匹配关键字的数据框列中的数据进行子集化
【发布时间】：2023-03-12 00:48:01
【问题描述】：

我有一个包含 30 列的数据框，其中一个列变量是人物标题。这些不遵循任何组或结构，因为许多标题都是独一无二的，但是我想选择其中包含某些单词的所有标题，例如“领导者”或“综合”。

我尝试过使用以下 select dplyr 函数：

df1<-select(df, Title, contains('digital'))

然而这并没有奏效。有什么想法吗？

【问题讨论】：

试试df[grep("\\b(leader|integrated)\\b", df$Title),] 尚不清楚您是对行还是列进行子集化。 select 方法用于对列进行子集化，但从描述看来，您似乎想根据“标题”列中的某些字符串对行进行子集化。给出一个可重复的小例子以及预期的输出不会有什么坏处。
首先子集您所需的列（选择用于列）。然后在子集中查找，这里以stackoverflow.com/questions/20782218/…为例

【解决方案1】：

我想你想像这个例子一样使用filter 和grepl：

iris %>% filter( grepl( "set" , Species))

这里，Species 是我匹配“设置”到的列。

【讨论】：