【发布时间】:2018-04-04 14:26:41
【问题描述】:
Spark Dataframe 包含一个包含 2 列的表: 状态,类别。
Status has values----'y' and 'n'
Category has values -'a', 'b' and 'c'
如何在 spark (Scala) 中找到每个类别中状态“y”的百分比? 我能够做到这一点。
df.groupBy("category").agg(count("*"))
df.filter(col("status")==="y").groupBy("category").count()
之后组合任何东西都会给我错误
【问题讨论】:
标签: sql scala apache-spark dataframe