【发布时间】:2020-04-16 12:41:31
【问题描述】:
我有一个如下图所示的数据框。
Place Bldng_Id Num_Bed_Rooms Contract_date Rental_value
Bangalore 1 4 2016-02-16 100
Bangalore 1 4 2016-05-16 150
Bangalore 1 4 2017-01-18 450
Bangalore 1 4 2017-02-26 550
Bangalore 5 4 2015-02-26 120
Bangalore 5 4 2016-05-18 180
Bangalore 2 3 2015-03-06 150
Bangalore 2 3 2016-05-14 150
Bangalore 2 3 2017-07-26 220
Bangalore 2 3 2017-09-19 200
Chennai 3 4 2016-02-16 100
Chennai 3 4 2016-05-16 150
Chennai 3 4 2017-01-18 450
Chennai 3 4 2017-02-26 550
Chennai 4 3 2015-03-06 150
Chennai 4 3 2016-05-14 150
Chennai 4 3 2017-07-26 220
Chennai 4 3 2017-09-19 200
Chennai 6 3 2018-07-26 250
Chennai 6 3 2019-09-19 280
从上面我想准备下面的数据框。
预期输出:
Place Num_Bed_Rooms Year Avg_Rental_value
Bangalore 3 2015 150
Bangalore 3 2016 150
Bangalore 3 2017 210
Bangalore 4 2015 120
Bangalore 4 2016 143.3
Bangalore 4 2017 500
Chennai 3 2015 150
Chennai 3 2016 150
Chennai 3 2017 210
Chennai 3 2018 250
Chennai 3 2019 280
Chennai 4 2016 150
Chennai 4 2017 210
我尝试了以下代码来实现这一点。
df.groupby(['Place', 'Year', 'Num_Bed_Rooms']).Rental_value.mean()
但是上面不能正常工作。
根据上述预期输出,我想编写一个时间序列代码来分别预测每个案例的下一年rental_value。
【问题讨论】:
标签: pandas scikit-learn time-series pandas-groupby