【问题标题】:Determine month given time range and expand to multiple rows确定给定时间范围的月份并扩展到多行
【发布时间】:2019-11-21 15:11:10
【问题描述】:

有没有办法从给定的时间范围中提取月份,并将其应用于基于该范围的价格? 也许最好通过例子来说明。我有一个包含报价开始和结束日期的价格范围:

d = {'Price': [12, 11, 14], 'Offer_From': ['2019-10-12', '2019-10-13', '2020-02-01'],'Offer_To': ['2019-12-31', '2019-10-31', '2020-05-31'],  }
df = pd.DataFrame(data=d)
df
   Price  Offer_From    Offer_To
0     12  2019-10-12  2019-12-31
1     11  2019-10-13  2019-10-31
2     14  2020-02-01  2020-05-31

我想要的是一个类似于下面的表格,其中月份名称是从时间范围中提取的:

d2 = {'Price': [12,12,12,11,14,14,14,14], 'Month': ['2019-10', '2019-11', '2019-12', '2019-10', '2020-02', '2020-03', '2020-04', '2020-05']}
df2 = pd.DataFrame(data=d2)
df2
   Price    Month
0     12  2019-10
1     12  2019-11
2     12  2019-12
3     11  2019-10
4     14  2020-02
5     14  2020-03
6     14  2020-04
7     14  2020-05

【问题讨论】:

  • @MartijnPieters 这是一个合适的副本吗?这个答案的解决方案涉及其他步骤......
  • @MartijnPieters 我重新打开了这个问题,因为副本不合适
  • 这可能是更接近的副本:stackoverflow.com/questions/42151886/…

标签: python pandas time period


【解决方案1】:

假设 Offer_FromOffer_To 都是 DateTime 列,您可以使用 date_range + explode 然后手动提取月份:

df['Month'] = df[['Offer_From', 'Offer_To']].apply(lambda x: pd.date_range(x[0], x[1], freq='M'), axis=1)
result = df.explode('Month').drop(['Offer_From', 'Offer_To'], axis=1)

result['Month'] = [f'{date.year}-{date.month:02d}' for date in result['Month']]

print(result)

输出

   Price    Month
0     12  2019-10
0     12  2019-11
0     12  2019-12
1     11  2019-10
2     14  2020-02
2     14  2020-03
2     14  2020-04
2     14  2020-05

【讨论】:

  • 感谢@Daniel Mesejo,它运行良好,但需要注意的是同一月份范围(即 2019/12/01 到 2019/12/15)将导致 nan,我可能会通过以下方式纠正这些问题过滤和应用 dt.month()
猜你喜欢
  • 1970-01-01
  • 2023-03-23
  • 1970-01-01
  • 2015-07-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-02-14
  • 1970-01-01
相关资源
最近更新 更多