【发布时间】:2018-09-08 03:16:59
【问题描述】:
我按照 Holden Karau 在https://www.oreilly.com/learning/extend-spark-ml-for-your-own-modeltransformer-types 的教程定制了一个玩具估算器“SimpleIndexer”。问题是在“CrossValidator”中使用它时出错。
错误是
Exception in thread "main" java.lang.NoSuchMethodException: ....SimpleIndexerModel.<init>(java.lang.String)
at java.lang.Class.getConstructor0(Class.java:3082)
at java.lang.Class.getConstructor(Class.java:1825)
at org.apache.spark.ml.param.Params$class.defaultCopy(params.scala:846)
at org.apache.spark.ml.PipelineStage.defaultCopy(Pipeline.scala:42)
at com.nextperf.feature.SimpleIndexerModel.copy(SimpleIndexer.scala:63)
之前有人问过类似的问题 - java.lang.NoSuchMethodException: <Class>.<init>(java.lang.String) when copying custom Transformer。显然问题来自“复制”方法。但是我尝试了帖子中提到的解决方案,但它不起作用。
- “SimpleIndexerModel”扩展了 DefaultParamsWritable 特征
- 添加扩展 DefaultParamsReadable 接口的 Companion 对象
class SimpleIndexerModel(override val uid: String, words: Array[String])
extends Model[SimpleIndexerModel] with SimpleIndexerParams with DefaultParamsWritable{
...
...
}
object SimpleIndexerModel extends DefaultParamsReadable[SimpleIndexerModel]
这个玩具示例的 spark 官方实现是“StringIndexer”。我找不到线索。有谁知道它为什么会发生,以及如何解决这个问题?
//"StringIndexerModel" works fine
val indexer1 = new StringIndexerModel("abc",Array("a"))
val m1 = indexer1.copy(new ParamMap())
//
//"SimpleIndexerModel" fails
val indexer2 = new SimpleIndexerModel("abc",Array("a"))
// This call throws the exception.
val m2 = indexer2.copy(new ParamMap())
【问题讨论】:
标签: scala apache-spark apache-spark-mllib