【发布时间】:2021-05-19 08:21:16
【问题描述】:
我有一个 DataFrame,其中有一列存储了与不同数据相关的更多重复项。
| A | B | |
|---|---|---|
| 1 | 120 | abc |
| 2 | 121 | def |
| 3 | 122 | ghi |
| 4 | 121 | abc |
| 5 | 120 | def |
| 6 | 121 | def |
| 7 | 122 | abc |
| 8 | 121 | ghi |
| .. | ... | ... |
我不知道 A 中重复的数量以及它们是谁,但我需要为每个重复提取 n-DataFrame,如下所示:
| A | B | |
|---|---|---|
| 1 | 120 | abc |
| 2 | 120 | def |
| .. | ... | ... |
| A | B | |
|---|---|---|
| 1 | 121 | def |
| 2 | 121 | abc |
| 3 | 121 | def |
| 4 | 121 | ghi |
| .. | ... | ... |
| A | B | |
|---|---|---|
| 1 | 122 | ghi |
| 2 | 122 | abc |
| .. | ... | ... |
我该怎么做? 也许我可以使用duplicated,但我不清楚我是否必须在我的情况下使用它。
【问题讨论】:
-
只需根据唯一键
{k : v for k,v in df.groupby('A')}创建一个字典