【发布时间】:2018-08-29 14:24:59
【问题描述】:
我有两个简单的数据框,其中包含“word”和“n”列,用于表示某个单词出现的频率。这是一个例子:
df1 <- data.frame(word=c("beautiful","nice","like","good"),n=c(400,378,29,10))
df2 <- data.frame(word=c("beautiful","nice","like","good","wonderful","awesome","sad","happy"),n=c(6000,20,5,150,300,26,17,195))
除了df1 的单词之外,df2 包含更多单词,因此df1 只是df2 的一小部分。
我找到了包含在df1 和df2 中的单词。如果特定单词包含在 df2 中,现在我想从 df2 中减去 df1 的单词计数,这意味着我想做以下事情:
- 减去字数:
df2$n - df1$n - 仅当
df1$word包含在df2$word中
我希望我的问题很清楚。
我已经找到了 df1 中也包含在 df2 中的所有单词
df1 %>% filter(df1$word %in% df2$word)
但是,基于 df1 中的单词必须也在 df2 中然后只减去 df2$n - df1$n 的条件,我正在努力使用减法命令
感谢您的帮助!
【问题讨论】:
-
您的示例与您的问题不符。
df1中没有词包含在df2中 -
是的,我意识到很抱歉,现在我改变了它
标签: r dataframe conditional-statements multiple-columns subtraction