【发布时间】:2021-09-12 15:53:37
【问题描述】:
我们可以对列子集的重复行求和:
df = pd.DataFrame({"source": [1, 1, 3, 1, 1],
"target":[2, 2, 5, 3, 3],
"value": [0.5, 1.0, 1.51, 0.2, 0.5]})
print(df)
print(df.groupby(['source','target'], as_index=False)["value"].sum())
source target value
0 1 2 0.50
1 1 2 1.00
2 3 5 1.51
3 1 3 0.20
4 1 3 0.50
source target value
0 1 2 1.50
1 1 3 0.70
2 3 5 1.51
如何以重复行为条件,例如仅与目标 2 重复的行
输出应该是这样的:
source target value
0 1 2 1.50
2 3 5 1.51
3 1 3 0.20
4 1 3 0.50
编辑:
稍后可以删除其他重复的行 (df.drop_duplicates(subset=["source","target"]))。
【问题讨论】: