【发布时间】:2016-04-30 11:00:34
【问题描述】:
我有一组 F 功能,例如实验室色彩空间,熵。通过将所有特征连接在一起,我得到了一个维度为 d 的特征向量(介于 12 到 50 之间,具体取决于选择的特征。
我通常会得到 1000 到 5000 个新样本,用 x 表示。然后用向量训练高斯混合模型,但我不知道这些特征来自哪个类。我所知道的是,只有 2 个类。根据 GMM 预测,我得到该特征向量属于第 1 类或第 2 类的概率。
我现在的问题是:如何获得最好的特征子集,例如只有熵和归一化的 rgb,这会给我最好的分类精度?我想这是可以实现的,如果由于特征子集的选择增加了类的可分离性。
也许我可以利用 Fisher 的线性判别分析?因为我已经有了从 GMM 获得的均值和协方差矩阵。但是我不是必须计算每个特征组合的分数吗?
如果这是一种没有回报的方法并且我走错了路和/或有任何其他建议,我会很高兴获得一些帮助?
【问题讨论】:
标签: classification feature-extraction feature-selection