根据是否发散及是否相关来选择

方差选择法

先计算各个特征的方差,根据阈值,选择方差大于阈值的特征

方差过滤使用到的是VarianceThreshold类,该类有个参数threshold,该值为最小方差的阈值,然后使用fit_transform进行特征值过滤

 

相关系数法

先计算各个特征对目标值的相关系数,选择更加相关的特征

 

递归特征消除法

使用一个基模型来进行多轮训练,经过多轮训练后,保留指定的特征数

通过estimator将基模型设置为线性模型(可以设置为其他类型),通过n_features_to_select=2将要选择的特征数设置为2

 1 import pandas
 2 from sklearn.feature_selection import RFE
 3 from sklearn.linear_model import LinearRegression
 4 
 5 data=pandas.read_csv("C:\\Users\\Jw\\Desktop\\python_work\\Python数据挖掘实战课程课件\\6.2\\data2.csv")
 6 
 7 feature=data[["月份","季度","广告费用","客流量"]]
 8 rfe=RFE(
 9     estimator=LinearRegression(),   #通过estimator将基模型设置为线性模型
10     n_features_to_select=2)   #要选择的特征数设置为2
View Code

相关文章: