【发布时间】:2020-03-16 08:33:42
【问题描述】:
在评估 SVM、RF 和 DT (max_depth = 3) 的性能时,我使用 RF 模型获得了非常出色的结果。被建模的数据是真实世界的数据。由于数据集不平衡,它们都使用分层交叉验证进行评估。
对于之前看到的 4 个不同类别,我得到了精度、召回率和 F1 的这些分数。
最初,数据集包含以下 4 个类的 values_counts:
- 进料故障-(Diff. P-set/P-actual): 4 098 个数据样本
- 喂料故障-(喂料安全电路故障):383个数据样本
- 发电机加热: 228 668 个数据样本
- 其他: 51 966 851 个样本
RF 怎么会比 SVM 和 DT 好这么多?
提前致谢!
【问题讨论】:
标签: python machine-learning scikit-learn svm