【发布时间】:2018-01-23 08:07:11
【问题描述】:
在尝试 AutoML 时,使用 nfolds = 3 和指定的 fold_column 时出现错误:
Cannot specify fold_column and a non-default nfolds value at the same time
有人有解决方法吗?还是我坚持使用默认设置?
【问题讨论】:
标签: h2o
在尝试 AutoML 时,使用 nfolds = 3 和指定的 fold_column 时出现错误:
Cannot specify fold_column and a non-default nfolds value at the same time
有人有解决方法吗?还是我坚持使用默认设置?
【问题讨论】:
标签: h2o
您看到此错误的原因是您尝试以两种不同的方式指定折叠。如果您想要随机创建的折叠,那么您可以使用nfolds 参数,H2O 将为您创建折叠。
如果您想要自定义折叠(以便您可以控制哪些观察进入哪个折叠),那么您可以在训练框架中添加一个包含折叠索引的列。然后将fold_column 设置为该列的名称。
您必须选择其中一个(不能同时选择两者)。
【讨论】:
fold_column 和fold_assignment 混淆了。哎呀。感谢您的快速反馈!
fold_column 和 fold_assignment 的理解都错了:我正在寻找一种方法来做相当于 scikit learn GroupKFold 的方法,方法是指定要分组的列。看起来您需要手动在进行分组的数据集中创建一个 kfold 列。