【发布时间】:2021-11-24 13:07:49
【问题描述】:
我想用之前的非 NA 值替换我的数据集中的 NA 值,但前提是 NA 在相同值之间。
为了说明这里有一个小数据样本:
date 1 2 3
1 2004-12-27 NA NA NA
2 2004-12-28 2.299 2.349 2.348
3 2004-12-29 NA NA NA
4 2005-01-03 NA NA NA
5 2005-01-04 NA NA NA
6 2005-01-05 2.299 NA NA
7 2005-01-06 NA NA NA
8 2005-01-10 NA NA NA
9 2005-01-11 2.299 2.349 2.348
10 2005-01-12 NA NA NA
11 2005-01-17 NA NA NA
12 2005-01-18 2.299 NA NA
13 2005-01-19 NA NA NA
14 2005-01-24 NA NA NA
15 2005-01-25 NA 2.369 2.368
16 2005-01-26 2.299 NA NA
17 2005-01-31 2.299 NA NA
18 2005-02-01 NA NA NA
19 2005-02-02 NA NA NA
20 2005-02-08 NA NA NA
理想的输出是:
date 1 2 3
1 2004-12-27 NA NA NA
2 2004-12-28 2.299 2.349 2.348
3 2004-12-29 2.299 2.349 2.348
4 2005-01-03 2.299 2.349 2.348
5 2005-01-04 2.299 2.349 2.348
6 2005-01-05 2.299 2.349 2.348
7 2005-01-06 2.299 2.349 2.348
8 2005-01-10 2.299 2.349 2.348
9 2005-01-11 2.299 2.349 2.348
10 2005-01-12 2.299 NA NA
11 2005-01-17 2.299 NA NA
12 2005-01-18 2.299 NA NA
13 2005-01-19 2.299 NA NA
14 2005-01-24 2.299 NA NA
15 2005-01-25 2.299 2.369 2.368
16 2005-01-26 2.299 NA NA
17 2005-01-31 2.299 NA NA
这是使用dput 的数据集的可重现样本:
structure(list(data_gas = structure(c(12779, 12780, 12781, 12786,
12787, 12788, 12789, 12793, 12794, 12795, 12800, 12801, 12802,
12807, 12808, 12809, 12814, 12815, 12816, 12822), class = "Date"),
`1` = c(NA, 2.299, NA, NA, NA, 2.299, NA, NA, 2.299, NA,
NA, 2.299, NA, NA, NA, 2.299, 2.299, NA, NA, NA), `3` = c(NA,
2.349, NA, NA, NA, NA, NA, NA, 2.349, NA, NA, NA, NA, NA,
2.369, NA, NA, NA, NA, NA), `4` = c(NA, 2.348, NA, NA, NA,
NA, NA, NA, 2.348, NA, NA, NA, NA, NA, 2.368, NA, NA, NA,
NA, NA)), row.names = c(NA, 20L), class = "data.frame")
我尝试了几个for 循环但没有成功。
任何帮助将不胜感激。
【问题讨论】:
-
1.您的
dput不完整。 2. 你已经显示了 20 行的输入和 17 行的输出,这令人困惑。 -
@Ronak Shah 我在上次编辑中更正了
dput。
标签: r dataframe na missing-data