【发布时间】:2013-08-24 17:34:38
【问题描述】:
我的原始数据集有 500 个实例 10 个类,并且存在类不平衡
为了减少类不平衡,我使用了过采样技术和我的 新数据集有 1500 个实例和 10 个类。
对于原始数据集,我应用了 j48 分类器并获得了 63% 的准确率
对于新的采样数据集,我应用了 j48 分类器并获得了 75% 的准确率。
我的问题是我怀疑我的数据对分类器过度拟合。
如何检查数据是否过拟合以及如何减少过拟合
【问题讨论】:
标签: classification weka