【发布时间】:2018-11-28 06:03:27
【问题描述】:
我有以下用 pyspark sql 编写的代码,如下所示:
dep_cus = sc_sql.sql("select cid, sum(trans_amnt) as run_bal, max(ds) as last_tran_date, mark_seg, province, local_body, branch, acc_type, int_rate from dep_sdf_temp group by cid, mark_seg, province, local_body, branch, acc_type, int_rate")
如何在 pandas 中编写这段代码?
【问题讨论】:
-
嗨,Subash,您能否编辑您的帖子以显示您在 pandas 中的尝试以及您遇到的问题?
标签: python pandas pyspark apache-spark-sql