【发布时间】:2022-08-09 20:00:27
【问题描述】:
我们如何在单个语句中同时使用 groupby 和 select 子句?
例如,在 SQL 中,我可以编写
select col_1,col_2 from table group by col_2;
如何在 Pyspark 中用一条语句写出相同的内容?
每个人都反对这个问题,如果它低于你的水平太多,你可以转到下一页。但对我来说,这是一个查询,我需要一些帮助。你可能认为你很酷,但我需要帮助。
-
如果答案有助于解决问题,请检查答案旁边的 ✓ 符号。否则,很高兴收到反馈。
-
不,我知道在 groupby 中使用聚合函数。我要问的是,如果我想像 SQL 一样选择多个列并应用组子句,我可以在单个语句中执行此操作吗?
标签: dataframe apache-spark pyspark group-by apache-spark-sql