【发布时间】:2017-04-02 10:43:12
【问题描述】:
我有一个大约 1GB 的数据集,它不适合内存(因为当我们在 R 中应用 LM 时,它也会创建其他消耗内存的变量)。我想知道在这种情况下是否有办法在 R 中仍然使用那些不错的机器学习包(例如 glm、随机森林、神经网络)来进行分析?我感谢任何建议和参考。
【问题讨论】:
-
检查HPC task view的“大内存和内存不足数据”部分
标签: r machine-learning packages scalability large-data