【发布时间】:2016-08-05 13:54:38
【问题描述】:
我想计算 SparkR 列(SparkR 数据框的)的不同元素:
df$col1
1
2
2
5
6
5
不同的元素:1,2,5,6
当我在我的 SparkR 列上尝试 countDistinct 时,我只得到这个结果:
> countDistinct(df$col1)
Column count(col1)
我必须使用 agg 功能吗?我尝试过但失败了,因为它似乎不适用于列。
【问题讨论】:
标签: r apache-spark count sparkr