【发布时间】:2019-05-02 20:22:38
【问题描述】:
考虑链接 PCA 和回归的任务,其中 PCA 执行降维,回归执行预测。
示例取自 sklearn 文档:
import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model, decomposition, datasets
from sklearn.pipeline import Pipeline
from sklearn.model_selection import GridSearchCV
logistic = linear_model.LogisticRegression()
pca = decomposition.PCA()
pipe = Pipeline(steps=[('pca', pca), ('logistic', logistic)])
digits = datasets.load_digits()
X_digits = digits.data
y_digits = digits.target
n_components = [5, 10]
Cs = np.logspace(-4, 4, 3)
param_grid = dict(pca__n_components=n_components, logistic__C=Cs)
estimator = GridSearchCV(pipe,param_grid)
estimator.fit(X_digits, y_digits)
如何使用FunctionTransformer 仅对我的特征集的一个子集执行降维(例如,将 PCA 限制为 X_digits 的最后十列)?
【问题讨论】:
标签: python scikit-learn pca