【发布时间】:2022-01-22 20:57:18
【问题描述】:
我真的不知道如何问这个问题,所以如果已经有答案,请不要恨我。
我有一个DataFrame f。它包含气象数据,更具体地说是温度数据。温度数据的列名是:
['tmp_m', 'tmpsfc', 'Maximum_temperature_height_above_ground_Mixed_intervals_Maximum', 'Minimum_temperature_height_above_ground_Mixed_intervals_Minimum']
我有一个“z”列,可以以米为单位指定海拔。如果未指定高程,则此列中的值为 nan。
我还有一个“时间”列,它是一个 DateTime 列。
我遇到的主要问题是 DataFrame 在创建时不是由我创建的,不是由 inner_joining 按时完成的,而是在另一列上完成的,因此我可以在 4 个温度数据列上拥有相同的时间,但是将它们放在不同的行上,因此当一个温度数据列在特定行有一个时间值时,其他温度数据列是 nan,除了最后 2 个温度数据列,因为它们最初是按时加入的,因为它们来自相同的来源。见下图:
我想做并且非常高效的是:
- 如果指定了纬度,则通过创建新列从长格式变为宽格式,例如,如果我在 2 米和 80 米处有 tmp_m 变量。我将 tmp_m 列转换为 2 列,一列是 tmp_m_2m,另一列是 tmp_m_80m
- “挤压”DataFrame,以便及时“连接”温度数据列
我认为要点 1 可以通过谷歌搜索从长到宽来完成,但我什至不知道用谷歌搜索要点 2 是什么
请帮助所有强大的 SO 神。
【问题讨论】: