【发布时间】:2017-11-15 01:00:36
【问题描述】:
我正在使用由h2o flow 生成的 DRF 模型。当针对这个模型运行新的输入数据时(在带有EasyPredictModelWrapper的java程序中使用它的MOJO),有大量的UnknownCategoricalLevels(使用getUnknownCategoricalLevelsSeen()和getUnknownCategoricalLevelsSeenPerColumn()methods检查)。
我的解决方法是仅使用那些预测置信度高于某个阈值(例如 0.90)的预测。 IE。模型选择的classProbability 必须大于要使用的阈值。
我的问题是:
- 这个解决方案是错误的(即实际上并没有解决/解决问题(例如
unknownlevels实际上不会影响类概率值))还是有效 解决方法解决问题? - 有没有更好的方法来解决这个问题?
谢谢。
【问题讨论】:
标签: machine-learning h2o