【问题标题】:How to perform automated removal of attributes from a set of a large number of attributes如何从大量属性集中自动删除属性
【发布时间】:2018-04-15 13:31:51
【问题描述】:

所以我有一个包含 2304 个 numeric 属性和类属性的大型数据集),我想执行特征选择以删除误导性和冗余属性。这是因为我将运行离散化以使其名义化,然后在数据集上运行朴素贝叶斯。

但是,在 Weka 的选择属性选项卡中,它仅按排名顺序列出它们。我知道预处理选项卡中有一个删除过滤器,但它只包含一个范围或数量的属性。

由于数据集如此之大,是否有自动删除这些的方法?

【问题讨论】:

    标签: machine-learning weka


    【解决方案1】:

    在预处理选项卡中, 选择 AttributeSelection 过滤器(监督属性过滤器)。 根据需要配置评估器和搜索。 申请。

    这只会保留通过过滤器的那些(当然保留类属性)。 如果您喜欢结果,请将其另存为新的 arff 文件。

    【讨论】:

    • 我选择了 InfoGain 过滤器,它仍然保留所有 2304 属性以及类,但不会删除任何属性。
    猜你喜欢
    • 1970-01-01
    • 2017-05-18
    • 2011-08-11
    • 1970-01-01
    • 2020-02-21
    • 1970-01-01
    • 2011-01-29
    • 2013-05-19
    • 2019-11-29
    相关资源
    最近更新 更多