【发布时间】:2018-05-17 11:16:54
【问题描述】:
我试图确保我不会对 h2o 如何与交叉验证和验证数据集一起使用感到困惑。我确定我只是对用于描述这一点的措辞感到困惑
library(mlbench)
library(h2o)
data(Sonar)
dfh2o = as.h2o(Sonar)
splits=h2o.splitFrame(dfh2o)
train = splits[[1]]
valid = splits[[2]]
gbm_no_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
gbm_val_frame <- h2o.gbm(x = colnames(df), y = "Class", training_frame = train, validation_frame = valid,
nfolds = 5, seed = 1234, ntrees = 4000, stopping_rounds = 5)
h2o.flow() ### to see the validation frame stopping under models.
在 gbm_no_val_frame 中用于提前停止的验证帧是什么?这如何停止以防止过度拟合?
我想我了解 gbm_val_frame 的工作原理 - 当训练的折叠/最终模型碰到“有效”框架时,当分数停止提高时,它会停止过度拟合?
只是想消除我在这里的任何疑问..
【问题讨论】:
标签: r validation cross-validation h2o