【发布时间】:2019-10-20 02:16:24
【问题描述】:
我正在通过sklearn.cluster.KMeans 与 MNIST 一起练习。
直观地说,我只是将训练数据拟合到 sklearn 函数中。但是我的准确率很低。我想知道我错过了哪一步。我应该首先通过 PCA 提取特征向量吗?还是我应该换一个更大的n_clusters?
from sklearn import cluster
from sklearn.metrics import accuracy_score
clf = cluster.KMeans(init='k-means++', n_clusters=10, random_state=42)
clf.fit(X_train)
y_pred=clf.predict(X_test)
print(accuracy_score(y_test, y_pred))
结果我很穷 0.137。有什么推荐吗?谢谢!
【问题讨论】:
-
KMeans是一种聚类算法,对于图像分类并不十分理想。您可以改用KNeighborsClassifier以及其他分类算法。
标签: python scikit-learn cluster-analysis k-means mnist