【发布时间】:2015-01-28 22:05:21
【问题描述】:
我有一个五类 SVM 多类问题。数据集很小(大约 160 个示例)且不平衡,即我的类很少有示例。到目前为止,我进一步将数据集限制为 110 个示例,以便使用平衡的训练集……这是正确的方法吗?还是我应该使用不平衡的训练集?在后一种情况下有什么优势?提前谢谢!
【问题讨论】:
标签: classification svm libsvm
我有一个五类 SVM 多类问题。数据集很小(大约 160 个示例)且不平衡,即我的类很少有示例。到目前为止,我进一步将数据集限制为 110 个示例,以便使用平衡的训练集……这是正确的方法吗?还是我应该使用不平衡的训练集?在后一种情况下有什么优势?提前谢谢!
【问题讨论】:
标签: classification svm libsvm
减少一个小集合是个坏主意。保留所有样品。如果课程是可分离的,一切都很好。如果不是,您可以使用“权重”功能来提升具有很少代表性的类。
【讨论】: