【发布时间】:2017-09-15 14:52:59
【问题描述】:
我正在尝试运行spark_sklearn中的示例代码
from sklearn import svm, datasets
from pyspark import SparkContext
from spark_sklearn import GridSearchCV
iris = datasets.load_iris()
parameters = {'kernel':('linear', 'rbf'), 'C':[1, 10]}
svr = svm.SVC()
sc = SparkContext()
clf = GridSearchCV(sc, svr, parameters)
clf.fit(iris.data, iris.target)
抛出一个 TypeError,完整的回溯:
Traceback (most recent call last):
"<stdin>", line 1, in <module>
"spark_sklearn/grid_search.py", line 272, in fit
return self._fit(X, y, groups, ParameterGrid(self.param_grid))
"spark_sklearn/grid_search.py", line 400, in _fit
best_estimator.fit(X, y, **fit_params)
TypeError: fit() argument after ** must be a mapping, not NoneType
我查看了 repo 中的问题,但没有这样的东西。有人可以帮我解决这个问题吗?
Environment Info:
python 3.5.2
spark 2.2.0
spark_sklearn 0.2.0
【问题讨论】:
-
一定是安装问题。请提供其他信息,例如:python 版本、spark-sklearn 的版本。您的 PYTHONPATH 环境是否已相应设置?等等。你必须确保任何人都有足够的信息来重现问题。
-
没有定义
sc(在官方示例中)并且文档字符串与spark_sklearn.GridSearchCV的internal code不兼容。对我来说,不使用它的理由很充分。 -
我对 python 2.7 有同样的问题
标签: python apache-spark scikit-learn