【发布时间】:2020-05-03 04:05:09
【问题描述】:
我在使用 python 从大型数据集中获取每年的最高值时遇到问题。
with open('GlobalLandTemperaturesByCity.csv') as csvfile:
data = pd.read_csv(csvfile)
changedata = data[data['City'].str.match('Pokhara') & data['Country'].str.match('Nepal')]
changedata = changedata.set_index(changedata['dt'])
#changedata = changedata['dt'].to_datetime()
usedata = changedata[changedata['dt']> '1970-1-1 01:00:00']
print(usedata)
这会产生
dt AverageTemperature AverageTemperatureUncertainty \
dt
1970-10-01 1970-10-01 16.388 0.395
1970-11-01 1970-11-01 10.569 1.017
1970-12-01 1970-12-01 7.455 0.194
1971-01-01 1971-01-01 5.508 0.435
1971-02-01 1971-02-01 7.458 0.413
... ... ... ...
2013-05-01 2013-05-01 20.069 0.719
2013-06-01 2013-06-01 21.168 0.407
2013-07-01 2013-07-01 21.503 0.316
2013-08-01 2013-08-01 21.541 0.478
2013-09-01 2013-09-01 NaN NaN
City Country Latitude Longitude
dt
1970-10-01 Pokhara Nepal 28.13N 84.55E
1970-11-01 Pokhara Nepal 28.13N 84.55E
1970-12-01 Pokhara Nepal 28.13N 84.55E
1971-01-01 Pokhara Nepal 28.13N 84.55E
1971-02-01 Pokhara Nepal 28.13N 84.55E
... ... ... ... ...
2013-05-01 Pokhara Nepal 28.13N 84.55E
2013-06-01 Pokhara Nepal 28.13N 84.55E
2013-07-01 Pokhara Nepal 28.13N 84.55E
2013-08-01 Pokhara Nepal 28.13N 84.55E
2013-09-01 Pokhara Nepal 28.13N 84.55E
我需要一种方法来获取每个月的数据,而只是获取每年的最高或最低数据? 任何帮助将不胜感激!
【问题讨论】:
-
我在这里没有看到任何问题。您打印 1970 年之后的所有数据。现在您计算年平均值,这就是您的结果。
-
你尝试了什么?也许使用
group_by()、min()和max()可以提供帮助。
标签: python pandas matplotlib data-science