【发布时间】:2020-02-25 19:55:57
【问题描述】:
我有一个分类问题,我必须找到前 3 个特征 使用具有 PCA、xgboost、RANDOM FOREST 的 VOTING CLASSIFIER 方法, LOGISTIC REG 和决策树。
我是初学者,我不知道如何使用投票分类器来获取特征重要性。
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.decomposition import PCA
from sklearn.ensemble import VotingClassifier
log_clf = LogisticRegression(random_state=2)
rnd_clf = RandomForestClassifier
(n_estimators=150, max_depth=3, min_samples_leaf=6,
max_features=0.3, n_jobs=-1, random_state=2)
gbm_clf= GradientBoostingClassifier
(n_estimators=150, max_depth=3, min_samples_leaf=3, max_features=0.3,
learning_rate=0.05, subsample=0.4,random_state=2)`
estimators = [('lr', log_clf), ('rf', rnd_clf), ('gbm', gbm_clf)]
voting_clf = VotingClassifier(estimators=estimators,voting='hard')
voting_clf.fit(train.drop(['target'],1),train['target'])
例外:它应该给我使用具有 pca、xgboost、dt、rf 和 lr 的投票分类器的变量的特征重要性。
【问题讨论】:
-
我不明白您是如何使用 PCA 的。您已经在上面的示例代码中导入了它,但没有在任何地方使用它。此外,PCA 是一种降维方法,而不是分类算法。
-
是的,因为我知道如何在投票分类器中使用 pca。当我遇到这个问题时,我什至感到困惑。所以,我只是在寻找任何方法。
-
一种可能性是在使用其他分类器之前使用 PCA 将维度降低到 3,例如请参阅此处的用户指南:scikit-learn.org/stable/auto_examples/decomposition/… 但这并不是您真正要求的。这是作业问题吗?你能告诉我们更多关于你想要达到的目标的细节吗?
标签: python machine-learning scikit-learn classification ensemble-learning