【问题标题】:Plot the size of each group in a groupby object in Pandas在 Pandas 的 groupby 对象中绘制每个组的大小
【发布时间】:2019-01-08 04:35:44
【问题描述】:

我有一个数据框,下面的代码为我提供了两个“分支”0 和 1 之一的每个性别的事务数。所以假设我们有以下 groupby 对象

data.groupby(['branch','gender']).agg(np.size)['count']
branch      gender
0           FEMALE    1317771
            MALE      1214686
1           FEMALE     254173
            MALE       179210
Name: count, dtype: int64

我这样做是因为我想创建一个条形图,显示每个性别和分支的交易数量。

我是这样做的:F 和 M 分别代表女性和男性。

plt.bar([0,1,2,3,],data.groupby(['end_reason','gender']).agg(np.size)['listener_id'],align='center')
plt.xticks(range(4),['F_0','M_0','F_1','M_1'])
plt.title("Number of transactions per gender and branch")

问题是我确信这不是正确的做法,因为我必须自己对标签进行硬编码。我认为可能有更好的方法来做到这一点,因为想象我们有更多的组,并且硬编码 xticks 中的所有组组合是不切实际的。谢谢

【问题讨论】:

标签: python pandas dataframe matplotlib group-by


【解决方案1】:

如果我理解正确并且你的 df 是这样的:

   branch  gender  listener_id
0       0    male            1
1       0    male            3
2       1  female            2
3       1  female            4
4       1    male            1

你可以这样做:

import matplotlib
import matplotlib.pyplot as plt
matplotlib.style.use('ggplot')
df.groupby(['branch','gender']).agg(np.size)['listener_id'].unstack().plot(kind='bar')
plt.show()

并且有:

【讨论】:

    猜你喜欢
    • 2019-06-12
    • 2018-05-13
    • 1970-01-01
    • 1970-01-01
    • 2022-01-19
    • 2017-03-07
    • 1970-01-01
    • 2014-09-23
    • 2021-08-02
    相关资源
    最近更新 更多