【发布时间】:2017-01-29 00:32:24
【问题描述】:
我正在尝试根据给定的训练集训练分类器(比如每类 100 个样本的 2 类问题)。如何训练我的分类器,使训练集中的一些样本(比如每个类的前 20 个样本)比其他样本更有价值? (由于某些原因,这些样本与测试集更相似,因此在训练分类器时应该考虑更重要) 如果我只是将这些样本复制几次可以吗?
我不知道这是否重要,但我的分类器包含一个特征选择步骤(一种基于过滤器的方法,称为基于快速相关的过滤器)和一个分类步骤(线性 SVM)。另外,我的测试集是完全不同的集,我根本不能用于训练的任何步骤。
【问题讨论】:
标签: machine-learning artificial-intelligence svm data-science