【发布时间】:2021-02-28 17:38:25
【问题描述】:
我是 python 新手,也是这个网站的新手。我和我的同事正在研究时间序列数据集。我们希望在数据集中引入一些缺失值,然后使用一些技术来填充缺失值,看看这些技术在数据插补任务中的表现如何。我们目前面临的挑战是如何以连续的方式而不是随机的方式将缺失值引入数据集。例如,我们想用 NaN 替换一段时间内的数据,例如连续 3 天。如果有人能指出我们如何完成这项工作的正确方向,我将不胜感激。我们正在使用 python。
【问题讨论】:
-
为了让我的问题更清楚,这里是我目前正在处理的数据样本的链接。 documentcloud.adobe.com/link/… 。我希望能够连续用 NaN 替换值,即连续 3 小时的值应该用 NAN 替换
标签: python dataframe time time-series nan