【发布时间】:2019-02-15 23:23:58
【问题描述】:
使用:Python 3.6、Pandas 0.22
我有一个 .csv 文件,我需要根据月份和位置从中获取平均值。这是数据中的一行,还有更多具有多个位置和日期的:
NAME DATE SNOW
GRAND RAPIDS GERALD R FORD INTERNATIONAL AIRPORT, MI US 1/1/2016, 0.7
到目前为止,我已经成功地根据月份和平均每月对信息进行了排序:
df2 = pd.read_csv("Data.csv")
gname = df2.groupby('NAME')
for NAME, NAME_df2 in gname:
df2['DATE'] = pd.to_datetime(df2['DATE'])
df2.groupby(df2['DATE'].dt.strftime('%B'))['SNOW'].mean().sort_values()
执行时:
DATE
August 0.000000
July 0.000000
June 0.000000
September 0.000000
May 0.000562
October 0.000966
November 0.019712
April 0.155592
March 0.248475
February 0.319048
January 0.622969
December 1.129986
Name: SNOW, dtype: float64
我的问题是,这段代码只是给出了无限循环中所有位置每月的总平均值。我不知道如何让我的输出根据每个位置每月的平均降雪量对数据进行排序。
【问题讨论】:
标签: python python-3.x pandas