一、数据集变换步骤

sklearn数据集变换
sklearn数据集变换

sklearn中的transformer类,有fittransform函数

二、Pipline(管道机制)

1. Pipline方法

Pipline将多个estimator级联成一个estimator。这样做考虑了数据处理一系列前后相继的固定流。比如feature extraction ——> normalization ——> classification

  • convience 只需调用一次fitpredict就可以在数据集上训练一组estimators
  • 联合参数选择(joint parameter selection) 添加grid search
    sklearn数据集变换
    sklearn数据集变换
    sklearn数据集变换

2. make_pipline方法

sklearn数据集变换

三、FeatureUnion

3.1 基本介绍

sklearn数据集变换

3.2 用法(与Pipline类似)

sklearn数据集变换
设定参数
sklearn数据集变换

四、特征抽取(Feature Extraction)

sklearn数据集变换

4.1 Loading Features from Dicts

DictVectorizer
sklearn数据集变换
sklearn数据集变换

4.2 Features hashing

sklearn数据集变换
sklearn数据集变换

4.3 Text Feature Extraction

sklearn数据集变换

相关文章: