【发布时间】:2021-03-11 03:58:10
【问题描述】:
我正在尝试使用 scikit learn 的递归特征消除和交叉验证来处理具有二进制类问题的 (5000, 37) 数据,并且每当我拟合模型时,算法就会进入无限循环。
目前,我正在关注这个例子:https://scikit-learn.org/stable/auto_examples/feature_selection/plot_rfe_with_cross_validation.html 关于如何使用这个算法。
我的数据是:
from sklearn.svm import SVC
from sklearn.model_selection import StratifiedKFold
from sklearn.feature_selection import RFECV
X = np.random.randint(0,363175645.191632,size=(5000, 37))
Y = np.random.choice([0, 1], size=(37,))
我尝试通过以下方式选择功能:
svc = SVC(kernel="linear")
rfecv = RFECV(estimator=svc, step=1, cv=StratifiedKFold(2),
scoring='accuracy')
rfecv.fit(X, Y)
代码挂起并进入无限循环,但是当我尝试使用另一种算法(例如 ExtraTreesClassifier)时,它工作得很好,这是怎么回事,请帮忙?
【问题讨论】:
标签: python python-3.x machine-learning scikit-learn feature-selection