【发布时间】:2018-04-15 13:31:51
【问题描述】:
所以我有一个包含 2304 个 numeric 属性和类属性的大型数据集),我想执行特征选择以删除误导性和冗余属性。这是因为我将运行离散化以使其名义化,然后在数据集上运行朴素贝叶斯。
但是,在 Weka 的选择属性选项卡中,它仅按排名顺序列出它们。我知道预处理选项卡中有一个删除过滤器,但它只包含一个范围或数量的属性。
由于数据集如此之大,是否有自动删除这些的方法?
【问题讨论】:
标签: machine-learning weka