【发布时间】:2021-07-04 06:11:15
【问题描述】:
我有日期框架,我必须根据过去 12 个月的数据对值进行子集化。每个类别的行数不相等,即频率不一样。因此,我们必须将开始日期作为该类别的最新日期和 12 个月前的值相加。现在这个值的数量可以不同,比如可以有一个值到 12 个值等等,即它不是固定的
以下是样本数据:
RIC DIVIDENDEXDATE Adjusted
==============================================
TECL.P 12/22/2020 0
TECL.P 9/22/2020 0
TECL.P 6/23/2020 0
TECL.P 3/24/2020 0.019
TECL.P 12/23/2019 0.111
TECL.P 9/24/2019 0.007
CSML.OQ 12/30/2020 0.146
CSML.OQ 9/24/2020 0.069
CSML.OQ 6/24/2020 0.62
CSML.OQ 3/25/2020 0.018
CSML.OQ 12/30/2019 0.0657
CSML.OQ 9/24/2019 0.6585
这里每个组都是 RIC,并且必须从 DIVIDENDEXDATE 中选择日期。我们应该保留介于每个 RIC 的最大/最新日期与最新日期后 12 个月内的任何行之间的日期。
我尝试了以下代码
df = data2.set_index('DividendExDate').last('12M')
但它不起作用
【问题讨论】: