【发布时间】:2015-06-03 15:31:06
【问题描述】:
我看到一个知名人士Tom Mitchell在中老年考试中的例子,如下:
考虑在总共有 1000 个特征的情况下学习分类器。 其中有 50 篇确实提供了有关课堂的信息。另外 50 个功能是 前 50 个特征的直接副本。最后的 900 个特征不是 内容丰富。假设有足够的数据来可靠地评估有用性 特征是,并且特征选择方法使用良好 阈值。
How many features will be selected by mutual information filtering?
解决方案:100
How many features will be selected by a wrapper method?
解决方案:50
我的挑战是如何实现这些解决方案?我做了很多尝试,但无法理解这背后的想法。
【问题讨论】:
标签: machine-learning classification data-mining pattern-recognition feature-selection