【发布时间】:2020-03-06 03:50:38
【问题描述】:
我有一个包含多个分类列的数据框,我想将所有这些汇总到一个分类列中,最好使用 Pandas。
例如,如果我有两列,分别命名为 category1 (c1) 和 category2 (c2),它们的数据范围都在 0 到 2 之间,我想将它们聚合到其他列 category (c) 中,这可以范围从 0 到 5,表示所有可能的分类值组合。
我会从这里开始:
d1 d2 c1 c2
1 1 NA 0
2 1 1 1
3 1 0 2
4 2 2 NA
5 1 NA NA
6 2 2 2
7 2 0 NA
8 2 0 2
到这里:
d1 d2 c
1 1 0
2 1 1
3 1 2
4 2 3
5 1 4
6 2 5
7 2 6
8 2 2
我尝试关注this,但它似乎不起作用并引发了一些错误,即 ValueError: cannot reindex from a duplicate axis。
我提前感谢任何帮助。
【问题讨论】: