如何在 XGBRegressor 中选择 'n_estimators' 和 'seed' 的值？ [关闭]

【问题标题】：How to choose the values of 'n_estimators' and 'seed' in XGBRegressor? [closed]如何在 XGBRegressor 中选择 'n_estimators' 和 'seed' 的值？ [关闭]
【发布时间】：2021-05-05 01:51:02
【问题描述】：

我只知道线性回归，其他一无所知。任何速记解释或技巧都可以。

【问题讨论】：

种子用于使价格具有确定性，任何值都应该这样做。至于任何其他参数，请阅读超参数调整。
请按以下步骤操作： 1. 阅读以下文档：SO Tour、How to ask a good question & On Topic。 2.Edit，并改写问题，提供minimal reproducible example，包含代码、数据、错误、当前和预期输出，如formatted text

标签： machine-learning regression data-science random-forest xgboost

【解决方案1】：

seed 只是一个随机数，用于为算法添加随机性。把你的幸运号码放在那里。

n_estimators 是一个超参数，用于确定在集成模型中构建了多少树/估计器。由于 Gradient Boosting 算法的性质，你使用的越多，它就越准确。不利的一面是，n_estimators 的大小越大，训练所需的时间就越长，并且可能会过度拟合您的训练数据，但同样考虑到算法的性质，它可能不会。

关于n_estimators 需要考虑的另一件事是，您可以在没有太多估计量（即 300 或 500）的情况下获得良好的分数，然后，更大的估计量（即 2000）只会增加潜在的过拟合.

【讨论】：