【发布时间】:2020-10-19 16:58:14
【问题描述】:
我有一个包含 doc_id 和 feats 列(两个字符向量)的数据框。我正在尝试为每个doc_id 创建一个新列n_rel_prn,其中包含feats 列中值'PronType=Rel' 的总出现次数。
我不能使用 filter(),因为它会过滤掉我需要的所有其他数据(即feats 的值不是'PronType=Rel'),否则它可以解决问题。 (这是代码 sn-p:)
tcorpus %>% group_by(doc_id) %>%
filter(feats=='PronType=Rel') %>%
mutate(n_rel_prn = n())
基本上,我需要一些类似于以下代码的东西(除了实际可行——这显然不可行):
tcorpus %>% group_by(doc_id) %>%
mutate(n_rel_prn = NROW(feats == 'PronType=Rel'))
有没有办法计算'PronType=Rel' 观察的数量(按 doc_id 分组)并将这些总数添加到新列中? (我假设至少group_by %>% mutate() 是要走的路。)
【问题讨论】: