【发布时间】:2014-10-29 17:15:35
【问题描述】:
我从 UCI 机器学习数据集库下载了一个大文件。 (~300mb)。
有没有办法在将数据集加载到 R 内存之前预测加载数据集所需的内存?
谷歌了很多,但我能找到的所有地方都是如何使用 R-profiler 和其他几个包计算内存,但在将对象加载到 R 之后。
【问题讨论】:
-
取决于它的存储方式(以及存储方式)。基本上您可以使用 C 等效值进行计算,然后添加一些 R 开销。
-
根据经验,我注意到如果我压缩一个 csv 文件,压缩后的文件的大小与其对应的 .RData 文件大小差不多。
-
请理解 300MB 是一个适度的文件,而不是“巨大”。