【发布时间】:2022-04-16 07:17:07
【问题描述】:
我正在我的数据集上运行不同的机器学习模型。我正在使用 sklearn 管道尝试对数字特征进行不同的转换,以评估一种转换是否能提供更好的结果。我使用的基本结构很简单:
from sklearn.pipeline import Pipeline
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScalar
pipe = Pipeline(steps=[('stdscaler', StandardScaler()), ('clf', RandomForestClassifier())])
pipe.fit(X_train, y_train)
我正在尝试一系列转换,但我还想测试未对数字特征集执行转换的场景(即按原样使用特征)。有没有办法将其包含在管道中?比如:
pipe = Pipeline(steps=[('do nothing', do_nothing()), ('clf', RandomForestClassifier())])
【问题讨论】:
-
什么是“python 管道”?请不要让人猜测您使用的是什么库,请始终提供您在做什么的完整描述或minimal reproducible example
-
我很抱歉并感谢您的回复。我已经添加了更多具体信息以及我正在尝试做的事情。
标签: python scikit-learn