【发布时间】:2016-05-05 02:03:52
【问题描述】:
我想测试使用 Mallet 构建的文本分类器的准确性,有 4 种特征选择方法可用。(FeatureCounts、InfoGain、ExpGain 和 GradientGain)。 我想知道如何使用 ExpGain 和 GradientGain。
例如: 特征选择器 fselector=新特征选择器 (new FeatureCounts.Factory(),numOfFeature);
【问题讨论】:
我想测试使用 Mallet 构建的文本分类器的准确性,有 4 种特征选择方法可用。(FeatureCounts、InfoGain、ExpGain 和 GradientGain)。 我想知道如何使用 ExpGain 和 GradientGain。
例如: 特征选择器 fselector=新特征选择器 (new FeatureCounts.Factory(),numOfFeature);
【问题讨论】:
您提到的每个类都是 RankedFeatureVector 的子类。他们应用不同的规则为每个功能生成分数。然后,您可以通过传递 RankedFeatureVector 和要保留的特征数量来构造一个新的 FeatureSelection 对象。
This API page 展示了如何使用 FeatureSelection 对象来训练分类器。
【讨论】: