【发布时间】:2018-03-07 23:02:27
【问题描述】:
这应该很容易,但不知何故我找不到可行的解决方案。
我有一个看起来像这样的熊猫数据框:
index col1 col2 col3 col4 col5
0 a c 1 2 f
1 a c 1 2 f
2 a d 1 2 f
3 b d 1 2 g
4 b e 1 2 g
5 b e 1 2 g
我想按 col1 和 col2 分组,得到 col3 和 col4 的 sum()。 Col5 可以删除,因为无法聚合数据。
这是输出的样子。我有兴趣在结果数据框中同时拥有col3 和col4。 col1 和 col2 是否是索引的一部分并不重要。
index col1 col2 col3 col4
0 a c 2 4
1 a d 1 2
2 b d 1 2
3 b e 2 4
这是我尝试过的:
df_new = df.groupby(['col1', 'col2'])["col3", "col4"].sum()
然而,这只会返回 col4 的聚合结果。
我在这里迷路了。我发现的每个示例都只聚合一列,显然没有出现问题。
【问题讨论】:
-
问题可能是
df.col3.dtype可能不是int或数字数据类型。尝试df.col3 = df.col3.astype(int),然后再执行groupby
标签: python pandas dataframe pandas-groupby