【发布时间】:2021-10-07 10:12:30
【问题描述】:
我正在学习机器学习课程,在创建了两个决策树(第二个在网格搜索后具有最佳参数的决策树)之后,准确度得分略有下降。我必须解释为什么,但我很困惑,如果我们使用最好的参数,为什么分数会下降?问题如下:
将第一个决策树的准确度得分与执行网格搜索后的准确度得分进行比较。它有什么不同?您很可能会发现准确度得分有所下降。这是你所期望的吗?我们执行一轮网格搜索以阐明最佳超参数值。那么,为什么准确率得分下降了呢?最重要的是,是什么导致了准确度得分的下降?为什么?
【问题讨论】:
-
根据您设置数据的方式,您的模型可能会过度拟合训练集。你如何评估你的模型?你有单独的训练和验证集吗?当您执行网格搜索时,您是否在评估验证集的“准确性”?当您说使用和不使用网格搜索之间的准确性下降时,您是在使用相同的验证集比较准确性吗?
标签: python machine-learning decision-tree gridsearchcv