【发布时间】:2021-05-22 18:59:37
【问题描述】:
我正在尝试使用 k 近邻进行机器学习算法来训练程序。我有一个训练数据和一个测试数据,这是两个单独的 csv 文档,但是大多数机器学习算法都是训练测试拆分方法,这不是我需要的,因为训练测试拆分是在一个文档上进行训练和测试,但我正在对一个文档进行训练,并在一个文档上进行测试,所以我一直在思考如何使用训练数据和测试数据进行训练和测试。
以下是我从互联网上参考的一组代码。它没有显示错误,但也没有任何结果。谁能告诉我下面的这个python代码是否正确?有谁知道 k 最近邻的机器学习算法的正确代码?
#K-最近邻
从 sklearn.neighbors 导入 KNeighborsClassifier
将熊猫导入为 pd
从 sklearn.model_selection 导入 train_test_split
从 sklearn.preprocessing 导入 StandardScaler
从 sklearn.metrics 导入混淆矩阵
从 sklearn.metrics 导入 f1_score
从 sklearn.metrics 导入 accuracy_score
从 sklearn.datasets 导入 load_iris
从 sklearn 导入指标
从 sklearn.model_selection 导入 train_test_split
从 sklearn.preprocessing 导入 StandardScaler
iris = load_iris()
X = iris.data
y = iris.target
iris.data = 'train_data.csv'
iris.target = 'test_data.csv'
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X, y)
y_pred = knn.predict(X)
打印(metrics.accuracy_score(y, y_pred))
plt.show()
【问题讨论】:
标签: python python-3.x python-2.7