【发布时间】:2017-10-05 13:49:49
【问题描述】:
我有一个不完整的数据框,我想填充缺失值以匹配该组。
incomplete_table <-
tibble(id = c(1,1,2,2,3,3,3),
value = c("a",NA,"b","b","c","d", NA))
# # A tibble: 7 x 2
# id value
# <dbl> <chr>
# 1 1 a
# 2 1 <NA>
# 3 2 b
# 4 2 b
# 5 3 c
# 6 3 d
# 7 3 <NA>
对于数值我可以使用这样的东西:
complete_table <- incomplete_table %>%
group_by(id) %>%
mutate(value = max(value))
如何使用 dplyr 以类似的方式填充分类值? 这是我想要的结果:
# # A tibble: 7 x 2
# id value
# <dbl> <chr>
# 1 1 a
# 2 1 a
# 3 2 b
# 4 2 b
# 5 3 c
# 6 3 d
# 7 3 <NA>
【问题讨论】:
-
填充逻辑是什么?为什么第 7 行的
NA没有填满? -
我想在组中的所有值都相同时填充单元格。第 3 组既有“c”又有“d”,所以我不知道正确的值
标签: r group-by dplyr missing-data