【发布时间】:2016-06-22 10:50:43
【问题描述】:
我有超过 20k 个特征、3m 个对象和超过 3k 个类的文本分类问题。数据非常稀疏。 我在 R 上编写了程序。 sparseMatrix 对象中的数据矩阵。 如何选择此数据的特征? 我找到了 FSelector 包,但它不适用于 sparseMatrix,只有 data.frame,由于内存限制,我无法转换数据。
【问题讨论】:
-
3k 是一个非常大的分类数字。你用什么?一些层次分类?
标签: r sparse-matrix feature-selection fselector