【发布时间】:2020-04-15 16:53:39
【问题描述】:
我无法按小时对样本进行分组。数据结构如下:
data = [
{
"pressure": "1009.7",
"timestamp": "2019-09-03 08:03:00"
},
{
"pressure": "1009.7",
"timestamp": "2019-09-03 08:18:00"
},
{
"pressure": "1009.8",
"timestamp": "2019-09-03 08:33:00"
},
{
"pressure": "1009.8",
"timestamp": "2019-09-03 08:56:00"
},
{
"pressure": "1009.8",
"timestamp": "2019-09-03 09:03:00"
},
{
"pressure": "1009.8",
"timestamp": "2019-09-03 09:18:00"
},
{
"pressure": "1009.8",
"timestamp": "2019-09-03 09:33:00"
},
{
"pressure": "1009.7",
"timestamp": "2019-09-03 09:56:00"
},
{
"pressure": "1009.6",
"timestamp": "2019-09-03 10:03:00"
}
]
如您所见,每小时测量 4 次压力,我想计算每小时的平均值。我试过用 Pandas 实现这一点,但没有运气。我尝试的是提取开始和结束时间戳,将它们四舍五入到整小时,然后将其作为索引传递给 DataFrame,并将 json 作为数据传递,但存在形状不匹配(难怪)。我认为我可以像这样将它传递给 df 然后尝试计算平均值,但看起来我应该有一些中间步骤。
【问题讨论】: