【发布时间】:2017-01-20 13:36:50
【问题描述】:
我有一个数据集,我使用J48 和ID3 算法在WEKA 中进行分类。 J48算法的输出为:
Correctly Classified Instances 73 92.4051 %
Incorrectly Classified Instances 6 7.5949 %
Kappa statistic 0.8958
Mean absolute error 0.061
Root mean squared error 0.1746
Relative absolute error 16.7504 %
Root relative squared error 40.9571 %
Total Number of Instances 79
使用 ID3 的输出是:
Correctly Classified Instances 79 100 %
Incorrectly Classified Instances 0 0 %
Kappa statistic 1
Mean absolute error 0
Root mean squared error 0
Relative absolute error 0 %
Root relative squared error 0 %
Total Number of Instances 79
我的问题是,如果J48 是ID3 的扩展并且比它更新,为什么ID3 的结果比J48 更好?
【问题讨论】:
-
这对于 stats.stackexchange.com 来说是一个更好的问题。简而言之,模型在训练集上运行时的准确性并不能很好地衡量其实际质量。当对不在训练集中的数据运行时,J48 模型可能表现出更高的准确度。