基于 H2O 的随机森林模型在转换为 POJO 时预测始终为 1答案

【问题标题】：H2O-based random forest model predicts always 1 when converted to POJO基于 H2O 的随机森林模型在转换为 POJO 时预测始终为 1
【发布时间】：2017-11-11 13:11:08
【问题描述】：

我是机器学习新手，使用随机森林算法对不平衡数据集进行预测。我在 R 中建立了模型，响应变量是一个二元分类变量 (0,1)。 R 中构建的随机森林模型会产生正确的分类，但是当将此模型转换为 h2o pojo 以构建应用程序时，模型仅返回“1”作为响应。

【问题讨论】：

标签： machine-learning pojo h2o

【解决方案1】：

[更新：答案是在编辑 OP 之前编写的，以澄清问题仅在转换为 POJO 之后出现 - 请参阅 cmets]

我敢打赌，您的数据集非常不平衡，即您的训练集中的 1 比 0 多得多。

即使您在模型拟合期间获得了良好的准确度，但在这种情况下，准确度作为指标是没有意义的，您应该改用准确度、召回率和混淆矩阵 - 谷歌“类不平衡”了解更多信息。

例如，如果 85% 的训练标签是 1，那么通过将所有个样本分类为 1（可以说，不是您真正想要做的）。

【讨论】：

我在 Rstudio 中运行模型时得到了正确的预测，但是当我在构建 h2o POJO 并在 gradle builder 上运行后运行相同的模型时，我得到这个错误，即所有的类输出都为 1我的测试数据
@VenkataKrishnan 以及为什么您没有在帖子中包含此信息？