【发布时间】:2013-07-17 19:04:17
【问题描述】:
我想读入一些 CSV 文件 (~50),运行一些操作,然后使用write.csv() 输出一个主文件。由于 CSV 文件较大(~80 Mb),我想知道打开两个 R 实例是否更有效,在一个实例上读取一半的 CSV,在另一个实例上读取一半。然后我会将每个写入一个大的 CSV,读入两个 CSV,并将它们组合成一个主 CSV。有谁知道运行两个 R 实例是否会缩短读取所有 csv 的时间?
我使用的是配备 4Gb RAM 的 Macbook Pro OSX 10.6。
【问题讨论】:
-
我可以通过编写 80Mb csv 的经验告诉你并不是很慢。但这另一方面取决于您在上下文中所说的“慢”是什么意思。这些问题可能会有所帮助:stackoverflow.com/questions/12013953/… 和 stackoverflow.com/questions/9703068/…
-
这些很有帮助,但我指的问题是 加载 csv 文件的滞后。
-
你看过data.table包中的
fread吗?
标签: r performance