【发布时间】:2021-09-11 17:09:09
【问题描述】:
我的数据框如下所示:
date Temperature consumption
0 2020-12-01 8.0125 109.046450
1 2020-12-02 6.1500 104.494946
2 2020-12-03 5.9375 117.011582
3 2020-12-04 5.4750 109.615388
4 2020-12-05 3.8500 142.803438
5 2020-12-06 2.0500 158.638879
6 2020-12-07 0.1250 86.194107
7 2020-12-08 1.4750 121.847555
8 2020-12-09 2.4250 99.658973
10 2020-12-11 3.4250 76.806630
11 2020-12-12 7.5375 83.064948
12 2020-12-13 5.6750 82.401187
13 2020-12-14 9.9250 58.695437
14 2020-12-15 9.2875 64.574463
15 2020-12-16 7.0250 68.367383
16 2020-12-17 8.9125 84.487293
17 2020-12-18 8.6875 69.031144
18 2020-12-19 8.9500 65.048578
19 2020-12-20 8.6000 91.911185
20 2020-12-21 8.7625 60.022959
21 2020-12-22 12.7375 40.489421
22 2020-12-23 11.9875 43.049642
23 2020-12-24 6.1625 108.761981
24 2020-12-25 3.6875 105.727645
25 2020-12-26 3.8625 108.003397
我想创建一个名为“slope15”的新列,其值为前 15 行的线性回归 'consumption~Temperature' 的斜率。我怎样才能做到这一点?我尝试使用 .shift(15) 和 stats.linregress() 但没有按预期工作。
Tyvm
【问题讨论】:
-
你想对前 14 个值做什么?
-
我可以删除前 14 行或用 NA 填充它。这并不重要,因为我的数据框有数百行
标签: python pandas regression shift