【发布时间】:2015-10-23 08:02:12
【问题描述】:
我想在 Spark 1.4.x 的 CrossValidator 中找到 ParamGridBuilder 的参数,以使其成为最佳模型,
在 Spark 文档的 Pipeline Example 中,他们通过在管道中使用 ParamGridBuilder 添加不同的参数(numFeatures、regParam)。然后通过以下代码行,他们做出了最好的模型:
val cvModel = crossval.fit(training.toDF)
现在,我想知道ParamGridBuilder 中产生最佳模型的参数(numFeatures、regParam)是什么。
我已经使用了以下命令但没有成功:
cvModel.bestModel.extractParamMap().toString()
cvModel.params.toList.mkString("(", ",", ")")
cvModel.estimatorParamMaps.toString()
cvModel.explainParams()
cvModel.getEstimatorParamMaps.mkString("(", ",", ")")
cvModel.toString()
有什么帮助吗?
提前致谢,
【问题讨论】:
-
最好的参数是dumped to log,但我无法从
CrossValidatorModel实例中访问这些信息。 -
这真是令人沮丧。他们甚至没有在 PySpark 中记录它。缺少这么一个小而重要的东西......这让我想知道是否有人真的在使用这个功能。
-
各位,最新版本的 Spark 有解决这个问题的办法吗?
-
你肯定可以从
cvModel.bestModel得到它,请看下面我的回答 -
This SO thread 有点回答这个问题。
标签: scala apache-spark pipeline cross-validation apache-spark-mllib