【问题标题】:how to group columns without aggregation function in pandas?如何在熊猫中对没有聚合功能的列进行分组?
【发布时间】:2018-11-28 06:03:27
【问题描述】:

我有以下用 pyspark sql 编写的代码,如下所示:

dep_cus = sc_sql.sql("select cid, sum(trans_amnt) as run_bal, max(ds) as last_tran_date, mark_seg, province, local_body, branch, acc_type, int_rate from dep_sdf_temp group by cid, mark_seg, province, local_body, branch, acc_type, int_rate")

如何在 pandas 中编写这段代码?

【问题讨论】:

  • 嗨,Subash,您能否编辑您的帖子以显示您在 pandas 中的尝试以及您遇到的问题?

标签: python pandas pyspark apache-spark-sql


【解决方案1】:

这就是你要找的吗?

dep_cus = dep_sdf_temp.groupby(['cid', 'mark_seg', 'province', 'local_body', 'branch', 'acc_type', 'int_rate'])
                      .agg({'ds':'max', 'trans_amnt':'sum'})
                      .rename(columns={'ds':'last_tran_date', 'trans_amnt': 'run_bal'}) 

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-02-07
    • 2013-04-20
    • 2021-12-14
    • 2023-04-01
    • 2021-07-20
    • 2021-11-07
    • 1970-01-01
    相关资源
    最近更新 更多