【发布时间】:2018-02-10 21:18:57
【问题描述】:
我是堆栈溢出和熊猫的新手,但我很欣赏这个平台并有一个有趣的问题:我有一个熊猫数据框,它采用 NOAA 降雨数据(以 csv 格式表示有降雨的时间,不同年份但连续,一些数据丢失),用零替换 NaN,并为我们的水/管道工程师提供一个干净的每小时数据文件,这些数据文件可以从 NOAA 获得(完全不同)。但是,工程师想要一个 8760(非闰年的小时数)小时数据文件,它是 NOAA 提供的每一年中每小时的平均值。
例如,我有从 1987 年 7 月 1 日凌晨 1:00 到 2001 年 12 月 31 日凌晨 12:00 的每小时 NOAA 数据;我制作了一个巨大的每小时 df,但现在我需要制作一个每年 8760 小时的 df,其平均值为一年中每个小时的平均值(所有年份从 1 月 1 日凌晨 1:00 开始的平均值,从 1 月 1 日凌晨 2:00 开始的平均值在所有年份,...,从 12 月 31 日凌晨 12:00 开始的所有年份的平均值)请记住数据的开始和闰年!任何见解如何成功地做到这一点?
【问题讨论】:
-
欢迎您!请查看stackoverflow.com/help/mcve 以更好地格式化此问题,以便社区可以帮助您。发布代码示例、错误消息和更多详细信息,以便我们为您提供帮助!