【发布时间】:2016-01-28 14:20:21
【问题描述】:
我正在尝试使用 R 包 caret 训练模型。我的数据集相当大(60 万行),而且需要很长时间。
到目前为止,我使用以下代码。我重复了 cv(这就是 train 的目的),但只有 2 次重复和 5 次 cv 来加快速度。对于网格,我只采用了一组相当小的值。 然而,这需要几个小时。是否有可能中断训练查看到目前为止的结果并继续?
short.train.ctrl = trainControl(method = "repeatedcv",repeats=2,number=5)
grid <- expand.grid(shrinkage=c(0.1), n.trees=c(500),n.minobsinnode=c(1000),interaction.depth = c(7,8,9,10))
caret.train = train(target ~.,data = data[,filter],
method = "gbm",distribution="adaboost",
tuneGrid = grid,
metric = "accuracy",
trControl =short.train.ctrl
)
【问题讨论】:
-
我认为这是不可能的。但是您尝试过并行化吗?