【发布时间】:2019-11-06 11:39:01
【问题描述】:
我有一个包含资产价格(OHLC 资产数据)的数据框,它的索引是日期时间。数据应该以分钟为样本,但我的数据集缺少一些分钟。
为了填补缺失的数据,我只是使用了函数
df.resample("1Min").asfreq()
它会在一天内正确填写分钟,但由于我的数据框包含不同日期的数据,它通常会填写直到每天午夜的分钟。我希望,如果某一天包含从下午 13:05 到晚上 20:50 的数据,它仅在这些时间之间填充一分钟,即不超过这些范围。
我查看了 resample 函数的文档,但找不到它是如何完成的。感谢您的帮助!
【问题讨论】:
-
您能否使用两天的数据创建minimal, complete, and verifiable example 以查看预期输出的问题?
-
一种非常简单的方法是按天拆分 DataFrame,像现在一样重新采样,然后
pd.concat(dfs)重新组合它们。