【发布时间】:2021-02-04 22:47:53
【问题描述】:
我有一组保持不变的数据。我还没有确定存储它的最佳格式,可能是 DataFrame,但我愿意接受建议。
我的目标是向前滚动数据,因此我的静态数据集是最新的,但我需要保持日期一致。例如,如果我的静态数据如下所示:
Date Day Temp
0 01/01/2021 Fri 20
1 02/01/2021 Sat 17
2 03/01/2021 Sun 17
3 04/01/2021 Mon 16
4 05/01/2021 Tue 20
5 06/01/2021 Wed 16
6 07/01/2021 Thu 21
7 08/01/2021 Fri 19
我将拥有的最后一个数据是 08/01/2021。如果我要在 2021 年 9 月 1 日运行这些数据,它看起来像:
Date Day Temp
0 02/01/2021 Sat 17
1 03/01/2021 Sun 17
2 04/01/2021 Mon 16
3 05/01/2021 Tue 20
4 06/01/2021 Wed 16
5 07/01/2021 Thu 21
6 08/01/2021 Fri 19
7 09/01/2021 Sat 17
09/01/2021 是星期六,因此它将数据集中上一个星期六的数据向前滚动,即 02/01/2021。
我无法提前确定数据集将包含多少天,并且我可能必须多次前滚数据,例如,静态数据集中的最后一个数据可能是 15/05/ 2018 年,我需要把它延续到今天。
我看过 numpy roll 和 pandas shift,但我很难让日子保持一致。
出于兴趣,可以进一步改进这一点。它不是匹配最早的日期并将其向前滚动,而是首先尝试匹配具有相同月份和日期的最旧数据 - 以便每月温度保持一致?
谢谢
【问题讨论】:
-
出于好奇,为什么要根据星期几保持温度不变?温度通常每天在每月平均值附近变化,而每月平均值在一年中变化(即 1 月与 6 月的平均温度)?
-
嗨,@itprorh66。这就是我试图通过匹配相同的月份和日期来实现的目标 - 除非你认为这行不通?
标签: python python-3.x pandas date