【发布时间】:2020-11-08 21:15:19
【问题描述】:
我正在尝试使用机器学习来识别作物类型。这是一个像素级的分类。我有 16 个类(目标),这是我的训练和测试数据集的形状:
X_train, X_test, Y_train, Y_test=train_test_split(Features, Labels, test_size=0.25)
X_train.shape, X_test.shape, Y_train.shape, Y_test.shape
#((48330, 420), (16110, 420), (48330,), (16110,))
我想先用基线模型进行实验,所以我做了以下操作:
classifier=RandomForestClassifier()
classifier.fit(X_train, Y_train)
y_pred = classifier.predict(X_test)
print(confusion_matrix(Y_test,y_pred))
print(classification_report(Y_test,y_pred))
print(accuracy_score(Y_test, y_pred))
这是最终结果:
我不确定这里发生了什么,为什么我有这么高的指标? PS:我的数据集高度不平衡。
【问题讨论】:
标签: python machine-learning random-forest multiclass-classification