【发布时间】:2021-05-09 01:37:33
【问题描述】:
是否可以并行拟合 scikit-learn 模型?类似的东西
model.fit(X, y, n_jobs=20)
【问题讨论】:
标签: python machine-learning scikit-learn
是否可以并行拟合 scikit-learn 模型?类似的东西
model.fit(X, y, n_jobs=20)
【问题讨论】:
标签: python machine-learning scikit-learn
这实际上取决于您要拟合的模型。通常在初始化模型时它会有一个n_jobs 参数。见glossary on n_jobs。例如随机森林:
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_jobs=10)
如果它是一种集成方法,那么并行化是有意义的,因为您可以单独拟合模型(请参阅help page for ensemble methods)。 LogisticRegression() 也有一个 n_job 选项,但老实说,如果这是你的瓶颈,我真的不知道这会加快装配过程的速度。另见post
其他方法,如弹性网络、线性回归或 SVM,我认为没有并行化选项。
【讨论】: