【发布时间】:2018-05-21 14:52:30
【问题描述】:
我正在 Matlab 中实现递归特征消除 (RFE) 算法,并且有以下算法问题:
使用 RFE,我想绘制用于分类的特征数量与分类准确度的关系。现在说我有 5 个特征,我根据线性分类器赋予它们的权重(例如线性 SVM)对它们进行排名。哪种方法是正确的:
- 根据训练集 k 对特征进行排名,并根据这个特定排名计算在 {1,...,5} 特征中使用 n 的准确度(因此基于相同排名的准确度计算 5火车组)
或
- 根据训练集对特征进行排名,计算 n 个特征的准确度,根据下一个训练集再次对特征进行排名,现在计算前 n+1 个特征的准确度
在我看来 1 是正确的,因为相同的训练集用于计算 1、...、5 个特征的准确度,使其具有一定的可比性 - 对吗?
【问题讨论】:
标签: matlab machine-learning classification