【发布时间】:2016-06-23 07:36:06
【问题描述】:
我正在使用Weka GUI 进行分类。我是 Weka 的新手,对选项感到困惑
- 使用训练集
- 提供的测试集
- 交叉验证
为了训练我的分类算法(例如 J48),我用交叉验证训练了 10 次,准确率非常好(97%)。当我测试我的分类时 - 准确率下降到大约 72%。我感到很困惑。请问有什么提示吗?我就是这样做的:
- 我根据训练数据训练我的模型(例如:
train.arff) - 我在结果列表中右键单击要保存的模型的项目
选择保存模型并将其保存为例如
j48tree.model
然后
- 我加载了测试数据(例如:
test.arff通过提供的测试集按钮 - 在Results列表中右击,我选择Load model,然后选择j48tree.model
- 我选择了
Re-evaluate model on current test set
是我做错了吗?为什么准确率从 97% 惨跌到 72%?还是只做 10 折的交叉验证就足以训练和测试分类器?
注意:我的训练和测试数据集具有相同的属性和标签。唯一的区别是,我有更多关于测试集的数据,我认为这不会有问题。
【问题讨论】:
标签: machine-learning classification weka