【问题标题】:How to run randomForest in R on multiple cores in parallel? [duplicate]如何在 R 中并行运行多个内核上的 randomForest? [复制]
【发布时间】:2018-10-04 09:17:46
【问题描述】:

我有一个要在多个核心上计算的 randomForest 模型。 如何让模型并行运行?

这不是 parallel execution of random forest in R 的重复,因为我不需要并行运行多个模型,我希望一个模型并行运行。

【问题讨论】:

  • @Florian 没问题,但请确认与运行完整模型相比,联合收割机是否能做到这一点。我的意思是,如果我将运行 foreach 并使用 1000 棵树的 5 次“迭代”并将其组合起来,就像用 ntree = 5000 做一个 randomForest 一样?
  • 据我所知;它们是等价的。随机森林只是生长具有一定随机性的独立树,因此这些树是否生长在不同的森林中并不重要。例如,如果我们种植增强型森林,情况就不同了,树木不再独立生长,而是按顺序生长。
  • 使用rangerrborist 会有所帮助。更快且开箱即用的并行化。

标签: r parallel-processing random-forest


【解决方案1】:

我使用doMC 包及其registerDoMC 函数。效果很好。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-05-01
    相关资源
    最近更新 更多