【发布时间】:2013-11-05 14:59:41
【问题描述】:
我有一组使用图像处理提取的 240 个特征。 目标是在训练后将测试用例分为 7 个不同的类别。每个类大约有 60 个观察值(即,每个类有大约 60 个特征向量,每个向量有 240 个分量)。
许多研究论文和书籍利用顺序前向搜索或顺序后向搜索从特征向量中选择最佳特征。 下图给出了顺序前向搜索算法。
任何此类算法都使用一些标准来区分特征。一种常用的方法是使用 Bhattacharyya 距离作为标准。 Bhattacharyya 距离是分布之间的散度类型度量。在一些研究和研究中,我发现给定 A 类的矩阵 M1,该矩阵由该类的所有 60 个特征向量组成,使得它具有 n=60 行和 m=240 列(因为总共有 240 个特征)和一个类BI的类似矩阵M2可以找出它们之间的Bhattacharyya距离并找到它们的相互依赖关系。
我的问题是如何将两者结合起来。如上所述,如何将 Bhattacharyya 距离作为选择算法中最佳特征的标准。
【问题讨论】:
标签: algorithm machine-learning data-mining feature-selection