【发布时间】:2016-01-10 05:00:18
【问题描述】:
我使用的管道与给定的in this example 非常相似:
>>> text_clf = Pipeline([('vect', CountVectorizer()),
... ('tfidf', TfidfTransformer()),
... ('clf', MultinomialNB()),
... ])
我使用GridSearchCV 在参数网格上找到最佳估计器。
但是,我想使用CountVectorizer() 中的get_feature_names() 方法获取我的训练集的列名。如果不在管道之外实现CountVectorizer(),这可能吗?
【问题讨论】:
标签: python scikit-learn pipeline