【发布时间】:2015-06-19 04:46:43
【问题描述】:
我有一个包含 2014 年月度数据的数据框,其中包含一系列 317 个股票代码(317 个股票代码 x 12 个月 = DF 中的 3,804 行)。我想将其转换为每日数据框(317 个代码 x 365 天 = 115,705 行)。因此,我认为我需要在将每月值分布到每个月的每一天时进行上采样或重新索引,但我无法让它正常工作。
数据框目前是这种格式:
>>> df
month ticker b c
2014-1 AAU 10 .04 #different values every month for each ticker
2014-2 AAU 20 .03
2014-3 AAU 13 .06
.
2014-12 AAU 11 .03
.
.
.
2014-1 ZZY 11 .11
2014-2 ZZY 6 .03
.
2014-12 ZZY 17 .09
这就是我想要的:
>>> df
day ticker b c
2014-01-01 AAU 10 .04 #same values every day in month for each ticker
2014-01-02 AAU 10 .04
2014-01-03 AAU 10 .04
.
2014-01-31 AAU 10 .04
2014-02-01 AAU 20 .03
2014-02-02 AAU 20 .03
.
2014-02-28 AAU 20 .03
.
.
.
2014-12-30 ZZY 17 .09
2014-12-31 ZZY 17 .09
我已尝试将 groupby 与按天重新采样相结合,但更新后的数据框将从日期“2014-01-13”而不是 1 月 1 日开始,并以“2014-12-01”而不是 12 月 31 日结束.我还尝试将月份值从“2014-1”更改为“2014-01-01”等,但重新采样的数据帧仍以“2014-01-01”结束。必须有一个更简单的方法来解决这个问题,所以我会很感激任何帮助。我整天都在兜圈子。
【问题讨论】:
-
看看
resample -
谢谢,埃德。我想我不够明确——我一直在尝试使用重采样,但更新后的 DF 从 1 月 13 日而不是 1 月 1 日开始。