【发布时间】:2017-11-08 10:14:50
【问题描述】:
鉴于此数据集,我想计算缺失的 NaN 值:
df = pd.DataFrame({'A' : [1, np.nan, 2 , 55, 6, np.nan, -17, np.nan],
'Team' : ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'],
'C' : [4, 14, 3 , 8, 8, 7, np.nan, 11],
'D' : [np.nan, np.nan, -12 , 12, 12, -12, np.nan, np.nan]})
具体来说,我想在“团队”列中对每个组进行计数(以百分比形式)。我可以通过这个得到原始计数:
df.groupby('Team').count()
这将获得非缺失数字的数量。我想做的是创建一个百分比,所以我不会得到原始数字,而是将它作为每个组中总条目的百分比(我不知道所有不均匀的组的大小)。我试过使用 .agg(),但我似乎无法得到我想要的。我该怎么做?
【问题讨论】: