如何在熊猫中对没有聚合功能的列进行分组？答案

【问题标题】：how to group columns without aggregation function in pandas?如何在熊猫中对没有聚合功能的列进行分组？
【发布时间】：2018-11-28 06:03:27
【问题描述】：

我有以下用 pyspark sql 编写的代码，如下所示：

dep_cus = sc_sql.sql("select cid, sum(trans_amnt) as run_bal, max(ds) as last_tran_date, mark_seg, province, local_body, branch, acc_type, int_rate from dep_sdf_temp group by cid, mark_seg, province, local_body, branch, acc_type, int_rate")

如何在 pandas 中编写这段代码？

【问题讨论】：

嗨，Subash，您能否编辑您的帖子以显示您在 pandas 中的尝试以及您遇到的问题？

标签： python pandas pyspark apache-spark-sql

【解决方案1】：

这就是你要找的吗？

dep_cus = dep_sdf_temp.groupby(['cid', 'mark_seg', 'province', 'local_body', 'branch', 'acc_type', 'int_rate'])
                      .agg({'ds':'max', 'trans_amnt':'sum'})
                      .rename(columns={'ds':'last_tran_date', 'trans_amnt': 'run_bal'})

【讨论】：