【发布时间】:2018-09-18 11:45:34
【问题描述】:
spark 版本是 2.2.0,scala 版本是 2.11。当我使用 ml lib 时,出现错误:“列特征必须是类型 org.apache.spark.ml.linalg.VectorUDT@3bfc3ba7 但实际上是 org.apache .spark.mllib.linalg.VectorUDT@f71b0bce。”
这是我的代码:
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.sql.DataFrame
import org.apache.spark.sql.functions._
val trainingData = dataSet
.select(col("features"), col("label")).cache()
val lr = new LogisticRegression()
.setMaxIter(maxIter)
.setRegParam(regParam)
.setElasticNetParam(0)
.setThreshold(threshold)
.setFitIntercept(false)
val lrModel = lr.fit(trainingData)
困扰了我好几天。谁能帮帮我?
【问题讨论】:
-
如果您有新问题,请直接提出,不要完全重写现有问题。
标签: apache-spark