【发布时间】:2021-02-06 05:58:46
【问题描述】:
我在 Spark 2.4.5 中编写此代码:
df_join is a dataframe.
var comByKeyResult: Dataset[((String, String), (Double, Int))] = df_join
.map(x => ((x(1).toString, x(3).toString), (x(9).toString.toDouble, x(1).toString.toInt)))
当我尝试编写comByKeyResult.combineByKey, 时,combineByKey 方法不可用。为什么?
我导入了以下库:import org.apache.spark.rdd._。我是否必须添加其他库或包?
【问题讨论】:
标签: scala apache-spark rdd