【发布时间】:2016-12-15 09:20:24
【问题描述】:
在没有 sql/hiveContext 的情况下,在 Spark 中使用 groupby-have 的语法是什么?我知道我能做到
DataFrame df = some_df
df.registreTempTable("df");
df1 = sqlContext.sql("SELECT * FROM df GROUP BY col1 HAVING some stuff")
但是我如何使用像
这样的语法来做到这一点df.select(df.col("*")).groupBy(df.col("col1")).having("some stuff")
这个.having() 似乎不存在。
【问题讨论】:
标签: java sql apache-spark dataframe apache-spark-sql