【发布时间】:2017-07-27 15:05:45
【问题描述】:
我有一个数据框 df1,它由跨时间的实体及其对应的值组成。 df1 看起来像这样:
Index Date ID Values
0 2016-11-15 1 3
1 2016-11-16 1 5
2 2016-11-16 2 6
3 2016-11-17 2 7
4 2016-11-18 2 2
显然,两个 ID 的日期之间存在间隔。
我首先想填补日期和 ID 空白,如下所示:
Index Date ID Values
0 2016-11-15 1 3
1 2016-11-16 1 5
2 2016-11-17 1 0
3 2016-11-18 1 0
4 2016-11-15 2 0
5 2016-11-16 2 6
6 2016-11-17 2 7
7 2016-11-18 2 2
然后,我想为“值”创建一个滞后列,以便它为每个 id 使用前一天的值:
Index Date ID Values Lagged Values
0 2016-11-15 1 3 Nan
1 2016-11-16 1 5 3
2 2016-11-17 1 0 5
3 2016-11-18 1 0 0
4 2016-11-15 2 0 Nan
5 2016-11-16 2 6 0
6 2016-11-17 2 7 6
7 2016-11-18 2 2 7
谢谢!
【问题讨论】:
标签: python pandas dataframe panel lag