【发布时间】:2016-01-13 13:58:09
【问题描述】:
我在 pandas 数据框 (X) 上运行 sk-learn 分类器。由于缺少一些数据,我使用 sk-learn 的 imputer 如下:
imp=Imputer(strategy='mean',axis=0)
X=imp.fit_transform(X)
然而,在这样做之后,我的特征数量减少了,大概是因为 imputer 只是摆脱了空列。
这很好,除了 imputer 将我的数据框转换为 numpy ndarray,因此我丢失了列/特征名称。稍后我需要它们来识别重要功能(使用clf.feature_importances_)。
如果我的初始数据帧的某些列已被估算器删除,我如何知道 clf.feature_importances_ 中的特征名称?
【问题讨论】:
标签: python pandas scikit-learn