【发布时间】:2014-03-07 18:18:58
【问题描述】:
我构建了一个具有 13 个特征(没有二进制特征)的分类器,并使用 scikit 工具(Normalizer().transform)为每个样本单独标准化。
当我进行预测时,它会将所有训练集预测为正数,将所有测试集预测为负数(不管它是正数还是负数)
我应该关注分类器、特征或数据中的哪些异常?
注意:1) 我分别对测试集和训练集(每个样本单独)进行归一化。
2)我尝试了交叉验证,但性能相同
3) 我同时使用了 SVM 线性和 RBF 内核
4) 我也尝试过不进行标准化。但同样糟糕的结果
5) 我有相同数量的正面和负面数据集(每个 400 个)和 34 个正面样本和 1000+ 个负面测试集样本。
【问题讨论】:
标签: machine-learning normalization svm prediction