【发布时间】:2020-12-26 11:10:51
【问题描述】:
我有一个包含时间序列数据的数据框。我想要做的是通过使用“N”分钟的 timedelta 替换中值来有效地填充不同列中的所有缺失值。例如,如果对于一列说我有 10:20、10:21、10:22、10:23、10:24 的数据,并且 10:22 中的数据丢失,那么 timedelta 为 2 分钟我会希望它被 10:20,10:21,10:23 和 10:24 的中值填充。
我可以做的一种方法是:
for all column in dataframe:
Find index which has nan value
for all index which has nan value:
extract all values using between_time with index-timedelta and index_+deltatime
find the media of extracted value
set value in the index with that extracted median value.
这看起来像是在运行 2 个 for 循环,而不是一个非常有效的循环。有没有有效的方法。
谢谢
【问题讨论】:
-
@TrentonMcKinney:这并不是我在问题中提到的那样使用两个 for 循环。
标签: python-3.x pandas dataframe time-series