【发布时间】:2015-09-19 19:05:03
【问题描述】:
我想在多个处理器上并行使用sklearn.grid_search.GridSearchCV()。这是我第一次这样做,但我的初步测试表明它似乎有效。
我正在尝试理解this 部分文档:
n_jobs:整数,默认 1并行运行的作业数。
pre_dispatch: 整数或字符串,可选控制在并行期间分派的作业数量 执行。减少这个数字可能有助于避免爆炸 当调度的作业多于 CPU 时的内存消耗 过程。这个参数可以是:
无,在这种情况下,所有作业都会立即创建,并且 产生。将此用于轻量级和快速运行的作业,以避免 由于作业的按需生成而导致的延迟 An int,给出 生成的作业总数 一个字符串,给出一个 作为 n_jobs 的函数的表达式,如 ‘2*n_jobs’
有人可以帮我分析一下吗?我无法理解n_jobs 和pre_dispatch 之间的区别。如果我设置n_jobs = 5 和pre-dispatch=2,这和只设置n_jobs=2 有什么不同?
【问题讨论】:
标签: scikit-learn