【发布时间】:2017-02-09 10:36:30
【问题描述】:
我正在尝试在 Spark 2.0.0 中对 Dataset[Row] (DataFrame) 执行简单映射。就这么简单
val df: DataSet[Row] = ...
df.map { r: Row => r }
但是编译器抱怨我没有向 map 函数提供隐式 Encoder[Row] 参数:
方法映射的参数不足:(隐含证据$7: 编码器[行])。
如果我首先转换为 RDD ds.rdd.map { r: Row => r },一切正常,但不应该有一种简单的方法来获得 Encoder[Row],就像元组类型 Encoders.product[(Int, Double)] 一样?
[请注意,我的Row 是动态调整大小的,因此无法轻易转换为强类型的Dataset。]
【问题讨论】:
标签: scala apache-spark-sql spark-dataframe