【发布时间】:2019-03-06 08:30:35
【问题描述】:
我知道我用一个问题问了很多问题,但这些是我在将Logistic Regression 用于Iris Dataset 时遇到的疑问
这是我在 iris 数据集上使用 LogisticRegression 的代码。
iris = datasets.load_iris()
X, y = iris.data, iris.target
x_train, x_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state= 81,
test_size=0.3)
logreg = LogisticRegression()
logreg.fit(x_train, y_train)
pred = logreg.predict(x_test)
accuracy_score(y_test, pred) # this gives accuracy
0.95555
我知道 LogisticRegression 在结果中通过预测 1 或 0 起作用,但对于此 iris 数据集将需要根据指定对 0 or 1 or 2 进行分类。
问)我需要使用 StandardScalar 标准化数据吗?
问)这是如何工作的?我知道LR 通过预测YES 或NO 起作用,但在这里(iris)我们必须预测0 或1 或2
Q) 如果LogisticRegression 也适用于多分类,那么我该如何优化我的上述代码,以便更好地预测我想尝试的其他多类数据集。
Q) 我需要转换我的y_train 还是需要进行任何类型的编码等才能使其工作?
如果有人能帮我解决这些问题,我将不胜感激。任何好的参考也值得赞赏。
【问题讨论】:
标签: python machine-learning scikit-learn