【发布时间】:2021-06-13 20:04:55
【问题描述】:
我有一个带有 矢量类型列的数据框,这是 onehot 编码器的结果。我们将列命名为 Vector。
使用案例类示例(向量:WhichType),我想将数据框映射到数据集:
val ds = dataframe.as[Example]
问题是:case类中的属性'vector'应该有哪一种类型。
我收到一条错误消息:
需要一个数组字段但得到了 structtype:tinyint,size:int,indices:array
;
【问题讨论】:
标签: scala apache-spark apache-spark-ml