【发布时间】:2019-05-27 01:48:04
【问题描述】:
抱歉,我是 rapidminer 的新手,对我的决策树的结果有点困惑。我增加了最小叶大小,这导致决策树更小更易读,但是我的准确度结果损失了 2%。有人要求我解释原因,但我不知道更好的树但更不准确的数据对我的数据有何影响。
任何帮助我们都非常感谢。
尼尔。
【问题讨论】:
抱歉,我是 rapidminer 的新手,对我的决策树的结果有点困惑。我增加了最小叶大小,这导致决策树更小更易读,但是我的准确度结果损失了 2%。有人要求我解释原因,但我不知道更好的树但更不准确的数据对我的数据有何影响。
任何帮助我们都非常感谢。
尼尔。
【问题讨论】:
增加最小叶子大小会阻止非常特殊的叶子,这只会“匹配”极少数示例。这样做通常是为了防止过度拟合,其极端形式只是以 100% 的准确度复制训练数据。尽管如此,您仍希望使模型在真实的新数据上更加稳健。因此,根据您估计准确度的方式,您预计在强制算法创建更通用的模型时准确度会有所下降。
另外,在谈论“更易读”的树时,不要尝试单独解释节点。不要假设根节点中的属性是最重要的。它始终是你通往叶子的路上的属性组合。
【讨论】: