【发布时间】:2020-08-05 07:51:23
【问题描述】:
我刚刚开始研究 Azure 数据块。
我在运行已创建的 Python NoteBook 时遇到了一些错误。
代码如下:
import mmlspark
from mmlspark import *
lime = TabularLIME()\
.setModel(randomForestModel)\
.setPredictionCol("predict")\
.setOutputCol("weights")\
.setInputCol("feat")
lime_model = lime.fit(eng_train_pipe)
lime_model.save('dbfs:/mnt/aimodels/rf-eng-lag-lime')
收到此错误:
NameError Traceback (most recent call last)
<command-2244283784192060> in <module>
2 from mmlspark import *
3
----> 4 lime = TabularLIME()\
5 .setModel(rfModel)\
6 .setPredictionCol("prediction")\
NameError: name 'TabularLIME' is not defined
集群运行时为:6.5(包括 Apache Spark 2.4.5、Scala 2.11)
【问题讨论】:
-
在 Azure Databricks 笔记本上也尝试过此操作后,安装 mmlspark(默认版本)后,我也遇到了同样的问题:@987654321 @](i.stack.imgur.com/TgC3J.png) 好像和mmlspark的版本(0.01...)有关,文档看一看也没多大帮助...我也试过安装更新的版本这在 Azure Databricks 中没有成功。顺便说一下,我认为这是一个与 stackoverflow 更相关的问题 :)
-
这个问题更适合 Stackoverflow,如果应该关闭,但由于您添加了赏金,我们无法投接近票。无论如何,documentation 表示您应该使用
lime.TabularLIME.TabularLIME,正如 Brian Spiering 所回答的那样
标签: machine-learning python pyspark lime