【发布时间】:2021-11-28 00:08:09
【问题描述】:
我在 Weka 中做机器学习任务,数据集有 486 个属性。所以,我想使用卡方进行属性选择,它为我提供了如下排名属性:
现在,我还有一个测试数据集,我必须使其兼容。但是如何以与训练集兼容的相同方式对测试属性进行重新排序?
【问题讨论】:
标签: data-mining weka
我在 Weka 中做机器学习任务,数据集有 486 个属性。所以,我想使用卡方进行属性选择,它为我提供了如下排名属性:
现在,我还有一个测试数据集,我必须使其兼容。但是如何以与训练集兼容的相同方式对测试属性进行重新排序?
【问题讨论】:
标签: data-mining weka
更改属性的顺序(例如,将Ranker 与属性评估器结合使用时)可能不会对分类器模型的性能产生太大影响(因为所有属性都将保留在数据集中)。另一方面,删除属性更有可能产生影响(为此,使用子集评估器)。
如果您也希望将排序应用于测试集,那么只需在 AttributeSelectedClassifier 元分类器中定义您的属性选择搜索和评估方案,而不是使用 属性选择面板(该面板更适合探索)。
【讨论】: