【发布时间】:2021-10-25 00:55:14
【问题描述】:
我卡住了。
我有一个巨大的数据框,看起来像这样:
| Index| Field|
| -------- | -------------- |
| 1| A|
| 1| B|
| 1| C|
| 2| A|
| 2| C|
| 3| A|
| 3| B|
起初我对索引进行分组并连接列“字段” 使用 pandas 和 groupby 命令。
现在我的数据框如下所示:
| Index| Field|
| -------- | -------------- |
| 1| [A, B, C]
| 2| [B, C]
| 3| [A, B]
下一步是,我想计算整个数据集中存在多少次 [A, B, C]。解决方案应该是这样的:
| Field | Counts|
| -------- | -------------- |
| [A, B, C]| 222
| [B, C] | 530
| [A, B] | 400
因为我把它放在一个列表(或 np 数组)中,我不知道如何实现下一个输出。因为我现在有一个列表/数组。我不能再做一个 pd.groupby 或让我瞎了眼。
任何人都可以给出一些提示或有解决方案如何解决这个问题?
谢谢!
编辑:抱歉编辑不好,stackoverflow 没有让我使用表格格式而不说这是一些代码
【问题讨论】:
-
根据您的样本数据,您的计数没有意义。
标签: python pandas numpy pandas-groupby