【发布时间】:2018-08-17 12:02:42
【问题描述】:
这是我的数据集的一个样本:
day city count
1 1 A 50
2 2 A 100
3 2 B 110
4 2 C 90
这里是重现它的代码:
df <- data.frame(
day = c(1,2,2,2),
city = c("A","A","B","C"),
count = c(50,100,110,90)
)
如您所见,城市 B 和 C 第 1 天的计数数据缺失。我想要做的是使用城市 A 的计数作为对其他两个城市的估计。所以期望的输出是:
day city count
1 1 A 50
2 1 B 50
3 1 C 50
4 2 A 100
5 2 B 110
6 2 C 90
我可以想出一个 for 循环来做到这一点,但我觉得应该有一个更简单的方法来做到这一点。我的想法是统计每天的观察次数,然后对于观察次数少于数据集中城市数量的日子,我会复制该行以完成当天的数据。有更好的想法吗?或更有效的for循环?谢谢。
【问题讨论】:
标签: r for-loop dataframe dplyr replicate