根据是否发散及是否相关来选择
方差选择法
先计算各个特征的方差,根据阈值,选择方差大于阈值的特征
方差过滤使用到的是VarianceThreshold类,该类有个参数threshold,该值为最小方差的阈值,然后使用fit_transform进行特征值过滤
相关系数法
先计算各个特征对目标值的相关系数,选择更加相关的特征
递归特征消除法
使用一个基模型来进行多轮训练,经过多轮训练后,保留指定的特征数
通过estimator将基模型设置为线性模型(可以设置为其他类型),通过n_features_to_select=2将要选择的特征数设置为2
1 import pandas 2 from sklearn.feature_selection import RFE 3 from sklearn.linear_model import LinearRegression 4 5 data=pandas.read_csv("C:\\Users\\Jw\\Desktop\\python_work\\Python数据挖掘实战课程课件\\6.2\\data2.csv") 6 7 feature=data[["月份","季度","广告费用","客流量"]] 8 rfe=RFE( 9 estimator=LinearRegression(), #通过estimator将基模型设置为线性模型 10 n_features_to_select=2) #要选择的特征数设置为2