【发布时间】:2018-09-25 17:22:10
【问题描述】:
我有我正在尝试优化的代码,作为我想尝试将 sql 代码重写为纯 Spark 的一种方式 现在我有了这个 sql:
val df_result_week_agg = sparkSession.sqlContext.sql("SELECT group_id, client_id ,m_id ,min(date) stats_date ,sum(trans_cnt) trans_cnt,sum(revenue) revenue,count(DISTINCT id) cust_total, count(distinct returning_hash_id) loyal_cust_total ,'W' time_period FROM customers GROUP BY group_id, client_id , me_id, year(date),date_sub(to_date(date),date_format(to_date(date), 'u')-1)")
是否有一些文章或如何帮助我重写它? 谢谢 !
【问题讨论】:
标签: apache-spark apache-spark-sql