【发布时间】:2017-03-03 03:18:40
【问题描述】:
我有一个如下所示的数据框:
d <- data.frame(county = c("Abilene", rep(NA, 5), "Cook", rep(NA, 4), "Blah", NA, "Allegheny", rep(NA, 3)))
county
1 Abilene
2 <NA>
3 <NA>
4 <NA>
5 <NA>
6 <NA>
7 Cook
8 <NA>
9 <NA>
10 <NA>
11 <NA>
12 Blah
13 <NA>
14 Allegheny
15 <NA>
16 <NA>
17 <NA>
我想在<NA> 中填写上一个非缺失县名的值。换句话说,我想这样结束:
county
1 Abilene
2 Abilene
3 Abilene
4 Abilene
5 Abilene
6 Abilene
7 Cook
8 Cook
9 Cook
10 Cook
11 Cook
12 Blah
13 Blah
14 Allegheny
15 Allegheny
16 Allegheny
17 Allegheny
到目前为止,我一直在循环遍历d$county 中的每个值,用每个非空县值的名称更新一个临时变量,并重新填充每个单元格。对于大型数据框,这非常慢。我更愿意在dplyr 中执行此操作,尽管我也对任何其他解决方案持开放态度。
【问题讨论】:
标签: r loops missing-data