【问题标题】:Extract data frame columns based on multiple criteria on column names根据列名上的多个条件提取数据框列
【发布时间】:2017-04-09 02:17:20
【问题描述】:

我想根据多列名称标准对数据框进行子集化。我有一个如下的数据框:

id  team_col_code1   team_col_code2 ... team_col_code78   Gender State team_cost_code1   team_cost_code2 ... team_cost_code43 

我正在尝试对此数据框进行子集化,以使新数据集仅包含包含单词 "col""id""Gender" 的列名的列。

我可以根据包含关键字 col 的列名创建一个子集,如下所示

new_Df <- df[grep("col", names(df))]

我不确定如何将其他两列 idGender 包含到此子集中,以便新数据集如下所示

id  team_col_code1   team_col_code2   ... team_col_code78   Gender

非常感谢任何帮助。谢谢。

【问题讨论】:

  • @ZheyuanLi 来自 UCLA 在线存储库的玩具数据集
  • @ZheyuanLi 已修复 :)

标签: r dataframe subset


【解决方案1】:

它可以很简单

df[c("id", grep("col", names(df), value = TRUE), "Gender")]

【讨论】:

    【解决方案2】:

    必须这样工作:

    df[,grepl("col|id|Gender",colnames(df))]
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-09-15
      • 1970-01-01
      • 2018-01-20
      • 1970-01-01
      • 2020-03-20
      • 2015-11-21
      相关资源
      最近更新 更多