【发布时间】:2015-04-21 08:09:44
【问题描述】:
我一直在单独使用一些特征选择方法,例如 RFE OR Select K best,用于多标签分类。是否有一种技术或方法可用于动态选择特征选择方法?例如,根据测试数据的统计或一些基于规则的方法?
【问题讨论】:
标签: machine-learning feature-selection
我一直在单独使用一些特征选择方法,例如 RFE OR Select K best,用于多标签分类。是否有一种技术或方法可用于动态选择特征选择方法?例如,根据测试数据的统计或一些基于规则的方法?
【问题讨论】:
标签: machine-learning feature-selection
这可能不是您要寻找的答案,但您可以尝试每一个,并针对一些测试数据进行交叉验证。编写这个脚本应该是相当简单的。
我不知道有什么比这更好的选择特征选择算法的方法,但它会让你偏向于你所使用的测试数据。
【讨论】:
我对特征统计的假设是:类之间的值均值之间的最大距离和一个类的值的最小方差对一个好的特征进行分类。
我从小的学习集开始,测试这个假设,如果结果看起来有希望增加学习集。
最后的优化是均值比较的直方图。具有相似直方图的特征被删除。这些是冗余特征,会显着降低(至少在 SVM 上)准确度(5-10%)。
通过这种方法,我在包含 5 个类别、600 个实例的数据集上获得了 95% 的准确率。训练时间
【讨论】: