【发布时间】:2023-03-20 16:09:01
【问题描述】:
我有一个 spark 数据框定义为:
+----------------+--------------------+-----------+
| id | amt_list|ct_tran_amt|
+----------------+--------------------+-----------+
|1 |[2.99, 7.73, 193....| 23|
|2 |[9.99, 9.95, 5.0,...| 17|
|3 |[4.57, 14.06, 0.7...| 19|
如何将近似分位数(第 1 和第 3)计算为新列?
df.stat.approxQuantile("amt",Array(0.25,0.75), 0.001) 不采用包装数组作为输入。
【问题讨论】:
标签: scala apache-spark spark-dataframe quantile