【发布时间】:2019-11-17 16:17:08
【问题描述】:
参考https://dzone.com/articles/machine-learning-with-h2o-hands-on-guide-for-data
我能够按照示例绘制 ROC 和 AUC 曲线,但是当我对数据执行相同操作时,我得到的是“评分历史 - 偏差”而不是“评分历史 - LOGLOSS”和我的“ROC 曲线 -训练指标”没有出现。
我的数据集有 2 个类,0、1,而不是示例中的 yes 和 no。什么决定了 ROC 曲线是否可移植?
2019 年 7 月 10 日更新了对 Maurever 回复的引用: 我的响应“标签”已“转换为枚举”并将分布更改为“bernoulli”,但我仍然无法绘制 ROC。
更新:对于和我有同样遭遇的未来用户。即使您转换为枚举,似乎 h2o 也无法使用类为“0”和“1”的响应。我的问题通过将 0 和 1 重新标记为“正常”和“恶意”来解决,并且将绘制 ROC 曲线。
【问题讨论】:
-
我刚刚看到你的更新。只要转换数据 H2O 就可以使用“0”和“1”的响应码。问题是你有
ENUM(3)而不是ENUM(2)。换句话说,您的数据中还有其他一些价值。它可能是“2”,但更可能是空格或其他东西。可能只有一排。清理数据并重试。按该列在电子表格中排序应该很容易找到它。
标签: machine-learning enums random-forest h2o roc