【发布时间】:2017-12-02 01:41:09
【问题描述】:
我有一个 SparkR DataFrame,我想为每个唯一的 name 获取模式(最常见)value。我怎样才能做到这一点?似乎没有内置的mode 函数。 SparkR 或 PySpark 解决方案都可以。
#Create DF
df <- data.frame(name = c("Thomas", "Thomas", "Thomas", "Bill", "Bill", "Bill"),
value = c(5, 5, 4, 3, 3, 7))
DF <- createDataFrame(df)
name | value
-----------------
Thomas | 5
Thomas | 5
Thomas | 4
Bill | 3
Bill | 3
Bill | 9
#What I want to get
name | mode(value)
-----------------
Thomas | 5
Bill | 3
【问题讨论】:
标签: pyspark spark-dataframe sparkr