【发布时间】:2016-04-19 10:17:54
【问题描述】:
问题:在对 800 万个特征应用 PCA 时出现 OutOfMemory 错误。
这是我的代码片段:-
from sklearn.decomposition import PCA as sklearnPCA
sklearn_pca = sklearnPCA(n_components=10000)
pca_tfidf_sklearn = sklearn_pca.fit(traindata_tfidf.toarray())
我想将 PCA / 降维技术应用于文本提取的特征(使用 tf-idf)。目前我有大约 800 万个这样的功能,我想减少这些功能并对我正在使用 MultiNomialNB 的文档进行分类。
由于 OutOfMemory 错误,我被卡住了。
【问题讨论】:
标签: python python-2.7 python-3.x scikit-learn pca