【发布时间】:2020-11-16 23:44:41
【问题描述】:
我有 2016 年选举的县级数据,我想根据每个县的获胜者创建虚拟变量。
df 格式如下:
FIPS candidate party votepct
1001 Clinton D 0.237
1001 Trump R 0.727
1001 Other NaN 0.034
1003 Clinton D ...
1003 ... ... ...
我想出了一种方法来检索每个县的获胜者,但我试图保留其余的列。这是我所拥有的:
df.groupby('FIPS')['votepct'].max().reset_index()
产量:
FIPS votepct
0 1001 0.727
1 1003 0.765
2 1005 ...
我意识到我可能会使用连接,但这感觉很草率。处理这个问题的正确方法是什么?
【问题讨论】:
-
请检查我的答案
标签: python pandas dataframe pandas-groupby dummy-variable