【发布时间】:2018-05-15 23:56:20
【问题描述】:
熊猫数据框示例:
ID 名称 COMMENT1 COMMENT2 NUM 1 dan hi 你好 1 1 你的朋友 2 3 乔恩 是的 不 3 2 乔恩狗猫 .5 3 乔恩 是 不 .1
我正在尝试创建一个按 ID 和 NAME 分组的数据框,该数据框将 COMMENT1 和 COMMENT2 连接起来,也就是 NUM。
这就是我要找的:
ID 名称 COMMENT1 COMMENT2 NUM 1 dan hi you hello 朋友 3 3 乔恩 是的 是的 不是的 3.1 2 乔恩狗猫 .5
我试过用这个:
input_df = input_df.groupby(['ID', 'NAME', 'COMMENT1', 'COMMENT2']).sum().reset_index()
但它不起作用。
如果我使用这个:
input_df = input_df.groupby(['ID']).sum().reset_index()
它对 NUM 列求和,但忽略所有其他列。
【问题讨论】:
-
Pandas groupby: How to get a union of strings 的可能重复项 - 那里接受的答案显示了如何使用 lambda 来获得你想要的东西