【发布时间】:2018-10-04 09:17:46
【问题描述】:
我有一个要在多个核心上计算的 randomForest 模型。 如何让模型并行运行?
这不是 parallel execution of random forest in R 的重复,因为我不需要并行运行多个模型,我希望一个模型并行运行。
【问题讨论】:
-
@Florian 没问题,但请确认与运行完整模型相比,联合收割机是否能做到这一点。我的意思是,如果我将运行 foreach 并使用 1000 棵树的 5 次“迭代”并将其组合起来,就像用 ntree = 5000 做一个 randomForest 一样?
-
据我所知;它们是等价的。随机森林只是生长具有一定随机性的独立树,因此这些树是否生长在不同的森林中并不重要。例如,如果我们种植增强型森林,情况就不同了,树木不再独立生长,而是按顺序生长。
-
使用
ranger或rborist会有所帮助。更快且开箱即用的并行化。
标签: r parallel-processing random-forest