【发布时间】:2018-05-27 02:30:11
【问题描述】:
我正在使用 sklearn 库来训练和测试我的数据。
targetDataCsv = pd.read_csv("target.csv","rt"))
testNormalizedCsv = csv.reader(open("testdf_new.csv","rt",encoding="utf-8"))
traningNormalizedCsv = pd.read_csv("traindf_new.csv", skiprows=1,nrows=99999)
df = pd.read_csv("testdf_new.csv", skiprows=1, nrows=9999)
我想使用 SGDClassifier 的 partial_fit 方法,因为我的训练数据有超过 200000 行。
X = traningNormalizedCsv.values
y = targetDataCsv.values
clf = SGDClassifier()
clf.partial_fit(X, y)
但是这个分类器没有 predict_proba 方法来获取我的测试数据的目标概率。
clf.predict_proba(df.values)
请提出建议。
【问题讨论】:
标签: python machine-learning scikit-learn