【发布时间】:2019-03-29 13:11:07
【问题描述】:
我有一个 pandas 数据框,我想按一列分组,同时平均一列并在另一列中找到最常出现的值
我能够做到,但我认为有一种简洁的方法可以做到这一点,而不是 4 行代码
import pandas as pd
df = pd.DataFrame({'Country' : ['USA', 'USA', 'Russia','USA', 'Russia', 'Russia'], 'City' : ['New-York', 'New-York', 'Sankt-Petersburg', 'Chicago', 'Moscow', 'Moscow'], 'Flights' : [22, 45, 32, 16, 31, 25]})
w=df.groupby('Country').mean().round(decimals=2)
x=(df.groupby('Country')['City'].agg(pd.Series.mode))
y=x.to_frame()
z = pd.concat([w, y], axis=1 ,join='outer')
Country Flights City
Russia 29.33 Moscow
USA 27.67 New-York
【问题讨论】: