【发布时间】:2020-02-18 00:24:57
【问题描述】:
我还是 python 和 pandas 的新手,目前正在尝试获取 CSV 文件中多列的总和。
我有一个 CSV 文件,其中包含要对 unitCount、orderCount、invoiceCount 求和的列:
date id name unitCount orderCount invoiceCount
2020-02-12 1 Guitar 200 100 200
2020-02-12 2 Drums 300 200 100
2020-02-12 3 Piano 400 700 300
2020-02-11 1 Guitar 100 500 300
2020-02-11 2 Drums 200 400 400
2020-02-11 3 Piano 300 300 100
我想要的输出是一个 CSV 文件,其中包含最后 3 列的总和(按 ID 分组)并仅链接到最新日期:
date id name total_unitCount total_orderCount total_invoiceCount
2020-02-12 1 Guitar 300 600 500
2020-02-12 2 Drums 500 600 500
2020-02-12 3 Piano 700 1000 400
有人可以帮忙吗?
到目前为止,我一直在尝试以下方法,但它对我不起作用。可以将groupby 添加到以下代码的第一行吗?还是我一开始就完全错了?谢谢!
df = pd.read_csv(r'path/to/myfile.csv', sep=';').sum()
df.to_csv(r'path/to/myfile_sum.csv')
【问题讨论】:
-
你真的需要熊猫吗?因为它可以通过生成另一个带有计算总数的 CSV 文件来解决。
标签: python pandas csv math sum