【问题标题】:What do the features given by a feature selection method mean in a binary classifier which has a cross validation accuracy of 0?特征选择方法给出的特征在交叉验证准确度为 0 的二元分类器中意味着什么?
【发布时间】:2014-02-28 21:32:42
【问题描述】:
所以我知道,给定一个二元分类器,你离准确度 0.5 越远,你的分类器就越好。 (即,一个错误的二元分类器可以通过总是颠倒其决定来转换为正确的分类器。)
但是,我有一个内部特征选择过程,它为我提供了“好”的特征来使用(我正在尝试递归特征消除,另一个基于 Spearman 的等级相关系数)。鉴于使用这些“好”特征的分类器的交叉验证准确度为 0,我是否仍然可以得出结论,选择的特征是有用的并且可以预测这个二元预测问题中的类别?
【问题讨论】:
标签:
machine-learning
classification
feature-selection
【解决方案1】:
为简化起见,让我们假设您在一些平衡集上进行测试。一半的测试数据是阳性的,一半的测试数据是阴性的。
我想说发生了一些奇怪的事情,正在改变你决定的迹象。您正在评估的分类器非常有用,但您需要改变它做出的决定。您可能应该检查您的代码以确保您没有翻转训练数据的类别。一些库(例如 LIBSVM)要求第一个训练示例来自正类。
总结一下:您选择的功能似乎很有用,但您似乎有一个正在翻转类的错误。