【问题标题】:How to choose feature selection method? By data or some rules?如何选择特征选择方法?通过数据还是一些规则?
【发布时间】:2015-04-21 08:09:44
【问题描述】:

我一直在单独使用一些特征选择方法,例如 RFE OR Select K best,用于多标签分类。是否有一种技术或方法可用于动态选择特征选择方法?例如,根据测试数据的统计或一些基于规则的方法?

【问题讨论】:

    标签: machine-learning feature-selection


    【解决方案1】:

    这可能不是您要寻找的答案,但您可以尝试每一个,并针对一些测试数据进行交叉验证。编写这个脚本应该是相当简单的。

    我不知道有什么比这更好的选择特征选择算法的方法,但它会让你偏向于你所使用的测试数据。

    【讨论】:

    • 我已经对它们中的每一个进行了测试,并对它们进行了交叉验证。是的,这肯定取决于数据,但是如何根据数据属性或性能选择特征选择方法?你有什么想法吗?谢谢
    【解决方案2】:

    这些answers may help

    我对特征统计的假设是:类之间的值均值之间的最大距离和一个类的值的最小方差对一个好的特征进行分类。

    我从小的学习集开始,测试这个假设,如果结果看起来有希望增加学习集。

    最后的优化是均值比较的直方图。具有相似直方图的特征被删除。这些是冗余特征,会显着降低(至少在 SVM 上)准确度(5-10%)。

    通过这种方法,我在包含 5 个类别、600 个实例的数据集上获得了 95% 的准确率。训练时间

    【讨论】:

    • 我猜你的方法类似于PCA(主成分分析),我之前用它来减少特征。是的,我也用 SVM 测试了一些特征选择方法,它们有不同的性能。
    猜你喜欢
    • 1970-01-01
    • 2014-09-21
    • 2011-01-05
    • 2020-07-07
    • 2016-03-03
    • 2021-02-04
    • 2016-10-01
    • 1970-01-01
    • 2013-02-21
    相关资源
    最近更新 更多