【发布时间】:2017-11-11 13:11:08
【问题描述】:
我是机器学习新手,使用随机森林算法对不平衡数据集进行预测。我在 R 中建立了模型,响应变量是一个二元分类变量 (0,1)。 R 中构建的随机森林模型会产生正确的分类,但是当将此模型转换为 h2o pojo 以构建应用程序时,模型仅返回“1”作为响应。
【问题讨论】:
标签: machine-learning pojo h2o
我是机器学习新手,使用随机森林算法对不平衡数据集进行预测。我在 R 中建立了模型,响应变量是一个二元分类变量 (0,1)。 R 中构建的随机森林模型会产生正确的分类,但是当将此模型转换为 h2o pojo 以构建应用程序时,模型仅返回“1”作为响应。
【问题讨论】:
标签: machine-learning pojo h2o
[更新:答案是在编辑 OP 之前编写的,以澄清问题仅在转换为 POJO 之后出现 - 请参阅 cmets]
我敢打赌,您的数据集非常不平衡,即您的训练集中的 1 比 0 多得多。
即使您在模型拟合期间获得了良好的准确度,但在这种情况下,准确度作为指标是没有意义的,您应该改用准确度、召回率和混淆矩阵 - 谷歌“类不平衡”了解更多信息。
例如,如果 85% 的训练标签是 1,那么通过将 所有 个样本分类为 1(可以说,不是您真正想要做的)。
【讨论】: