【问题标题】:How to traverse two columns and fill in another column at the same index with a string in R?如何遍历两列并用R中的字符串填充同一索引处的另一列?
【发布时间】:2018-11-20 01:43:19
【问题描述】:

我有一个数据框,其中有一列字符串是调查的问题主体,然后我有一个单独的数据框,这些问题主体与两个问题编号匹配。我想遍历原始数据框的列并检查该值是否与其他数据框中的任何值匹配,以及是否要将关联的问题编号存储在原始 df 的列中。我在弄清楚这一点时遇到了很多麻烦,我已经研究过使用 apply() 或类似的东西,但我不太明白。任何帮助将不胜感激。

【问题讨论】:

标签: r dataframe


【解决方案1】:

如果 df 是第一个数据框,df2 是第二个数据框,Q 是问题字符串列的名称,则:

library (dplyr) 
left_join(df1, df2, by=question_body) %>% select(-question_body)

当然,如果您提供一些数据结构的实际示例,则更容易为您提供准确的答案。

【讨论】:

  • 想象我们有 df1,它是一个包含列(question_id、question_body、participant_id)的矩阵,每列有数千个不同的行。然后是一个小得多的数据框 df2,它是一个包含列 (question_number, question_body) 的矩阵,并具有原始问卷的模板及其回复。现在 df1 要大得多,并且在 df2 中有很多重复的问题,但是如果有意义的话,我想用 df2 中的相应 question_number 替换 df1 中每个 question_body 的每个实例。
  • 这真的很难“想象”。如果您提供一个可重现的示例,那将是最好的。
  • 另外,你试过我的解决方案了吗?它应该适用于您所描述的内容。
猜你喜欢
  • 1970-01-01
  • 2021-04-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-07-05
相关资源
最近更新 更多