【发布时间】:2014-01-02 18:14:25
【问题描述】:
1) 如何在 weka 中应用 LSI 等特征缩减方法进行文本分类?
2) 应用 LSI 等特征缩减方法可以提高分类准确率吗?
【问题讨论】:
标签: machine-learning text-classification
1) 如何在 weka 中应用 LSI 等特征缩减方法进行文本分类?
2) 应用 LSI 等特征缩减方法可以提高分类准确率吗?
【问题讨论】:
标签: machine-learning text-classification
查看FilteredClassifier 类或AttributeSelectedClassifier。使用 FilteredClassifier,您可以使用诸如主成分分析 (PCA) 之类的特征减少方法。这是video 如何使用 PCA 过滤数据集,以便您可以在缩减数据集上尝试不同的分类器。
它可以提供帮助,但不能保证这一点。如果您删除冗余特征,或以某种方式转换特征(如 SVM 或 PCA),分类任务会变得更简单。无论如何,大量特征通常会导致curse of dimensionality,而属性选择是一种避免它的方法。
【讨论】: