【发布时间】:2015-05-13 01:01:57
【问题描述】:
我已经训练了一个预测CTR的gbdt模型,最初我使用40个特征,然后我添加了一些特征,但是结果(auc)低于原来的。 1. 怎么会这样? 2. 如何判断哪个特征对模型好?
【问题讨论】:
-
添加更多功能将使您的模型更加复杂。更复杂的模型容易过拟合。你可能想用谷歌搜索的术语是
feature selection。在这个领域有很多研究正在进行。您可能想搜索相关问题的统计信息:stats.stackexchange.com/questions/68692/…
标签: machine-learning statistics classification random-forest treemodel