【发布时间】:2018-01-19 11:23:06
【问题描述】:
我正在使用sklearn.pipeline.Pipeline 对象进行聚类。
pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
('transformer2': transformer2),
('clusterer': clusterer)])
然后我使用剪影分数来评估结果。
sil = preprocessing.silhouette_score(X, y)
我想知道如何从管道中获取X 或转换后的数据,因为它只返回clusterer.fit_predict(X)。
我知道我可以通过将管道拆分为
pipe = sklearn.pipeline.Pipeline([('transformer1': transformer1),
('transformer2': transformer2)])
X = pipe.fit_transform(data)
res = clusterer.fit_predict(X)
sil = preprocessing.silhouette_score(X, res)
但我想在一个管道中完成所有操作。
【问题讨论】:
-
说清楚,我有兴趣得到中间结果,例如
transformer1.fit_transform(df)和transformer2.fit_transform(transformer1.fit_transform(df))
标签: python-2.7 scikit-learn pipeline