【发布时间】:2017-09-18 09:43:16
【问题描述】:
我有一个 spark DataFrame,它按一个按计数聚合的列分组:
df.groupBy('a').agg(count("a")).show
+---------+----------------+
|a |count(a) |
+---------+----------------+
| null| 0|
| -90| 45684|
+---------+----------------+
df.select('a').filter('aisNull').count
返回
warning: there was one feature warning; re-run with -feature for details
res9: Long = 26834
这清楚地表明最初没有计算空值。
这种行为的原因是什么?我本来希望(如果 nullat all 包含在分组结果中)正确地看到计数。
【问题讨论】:
标签: sql apache-spark group-by null apache-spark-sql