【发布时间】:2016-12-30 20:44:46
【问题描述】:
我正在 matlab 中使用 glmnet 进行多项回归,并且有一个大约 6-10GB 的数据集,具体取决于我制作测试集的大小。我能够将它加载到内存中,但似乎 glmnetmex 无法处理整个数据集以进行更大的训练规模(例如留出一个)。我怀疑应该有一种方法可以将输入批处理到 glmnetmex,但我似乎在文档中找不到它。它是否存在,或者您对如何进行其他操作有任何建议?如果它有解决这个问题的方法,我可以使用 R 版本
【问题讨论】:
-
等等,你用的是R还是Matlab?
-
我使用的是 matlab,但实际上,glmnetmex 是 Fortran。如果 glmnet 的 matlab 或 R 版本可以处理这个问题,我可以使用任何一个实现(最好是 matlab)。我会在问题中更清楚地说明这一点。