【发布时间】:2020-08-30 13:57:24
【问题描述】:
我有一个如下所示的 DataFrame:
| date | week | quantity |
|-----------|------|----------|
| 1/1/2020 | 1 | 17 |
| 1/2/2020 | 1 | 15 |
| 1/3/2020 | 1 | 9 |
| 1/4/2020 | 1 | |
| 1/5/2020 | 1 | |
| 1/6/2020 | 1 | 3 |
| 1/7/2020 | 1 | 3 |
| 1/8/2020 | 2 | 10 |
| 1/9/2020 | 2 | 8 |
| 1/10/2020 | 2 | 8 |
| 1/11/2020 | 2 | |
| 1/12/2020 | 2 | |
| 1/13/2020 | 2 | |
| 1/14/2020 | 2 | 8 |
我需要通过在缺失日期之间分配最后一个已知值来估算缺失值。因此,对于第 1 周,我的输出应如下所示:
| date | week | quantity | quant_dist |
|----------|------|----------|------------|
| 1/1/2020 | 1 | 17 | 17 |
| 1/2/2020 | 1 | 15 | 15 |
| 1/3/2020 | 1 | 9 | 9 |
| 1/4/2020 | 1 | | 1 |
| 1/5/2020 | 1 | | 1 |
| 1/6/2020 | 1 | 3 | 1 |
| 1/7/2020 | 1 | 3 | 3 |
第 2 周应该是这样的:
| date | week | quantity | quant_dist |
|-----------|------|----------|------------|
| 1/8/2020 | 2 | 10 | 10 |
| 1/9/2020 | 2 | 8 | 8 |
| 1/10/2020 | 2 | 8 | 8 |
| 1/11/2020 | 2 | | 2 |
| 1/12/2020 | 2 | | 2 |
| 1/13/2020 | 2 | | 2 |
| 1/14/2020 | 2 | 8 | 2 |
我已经坚持了 2 多天了。有什么建议吗?
【问题讨论】:
-
这能回答你的问题吗? Forward fill missing values in Spark/Python
-
不完全向前填充..