【发布时间】:2018-11-20 16:59:30
【问题描述】:
我正在一个训练集上运行 CART 决策树,我使用 quanteda 对其进行了标记化,以完成常规文本分析任务。标记化生成的 DFM 被转换为数据框并附加了我预测的类属性。
与许多 DFM 一样,该表非常宽(33k 列),但仅包含大约 5,500 行文档。在我的训练集上调用 rpart 会返回堆栈溢出错误。
如果重要的话,为了帮助提高计算速度,我正在使用 doSNOW 库,这样我就可以在我的 4 个内核中的 3 个上并行运行模型。
我查看了at this answer,但不知道如何在我的 mac 工作站上执行相同的操作,以查看相同的解决方案是否适合我。有可能即使我增加 RStudio 的 ppsize,我仍然可能会遇到这个错误。
所以我的问题是如何增加 RStudio 的 maxppsize 在 Mac 上,或者更一般地说,如何修复此堆栈溢出以便我可以运行我的模型?
谢谢!
【问题讨论】: