【问题标题】:How to choose the values of 'n_estimators' and 'seed' in XGBRegressor? [closed]如何在 XGBRegressor 中选择 'n_estimators' 和 'seed' 的值? [关闭]
【发布时间】:2021-05-05 01:51:02
【问题描述】:

我只知道线性回归,其他一无所知。任何速记解释或技巧都可以。

【问题讨论】:

标签: machine-learning regression data-science random-forest xgboost


【解决方案1】:

seed 只是一个随机数,用于为算法添加随机性。把你的幸运号码放在那里。

n_estimators 是一个超参数,用于确定在集成模型中构建了多少树/估计器。由于 Gradient Boosting 算法的性质,你使用的越多,它就越准确。不利的一面是,n_estimators 的大小越大,训练所需的时间就越长,并且可能会过度拟合您的训练数据,但同样考虑到算法的性质,它可能不会。

关于n_estimators 需要考虑的另一件事是,您可以在没有太多估计量(即 300 或 500)的情况下获得良好的分数,然后,更大的估计量(即 2000)只会增加潜在的过拟合.

【讨论】:

    猜你喜欢
    • 2020-07-01
    • 1970-01-01
    • 2014-09-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-08
    • 2021-12-07
    • 2021-09-24
    相关资源
    最近更新 更多