【发布时间】:2014-09-12 09:44:41
【问题描述】:
我有一个包含 1 和 0 的大型(450MB / 2.5 亿行)平面文件,看起来像这样...
1
0
0
1
0
1
0
etc...
我正在使用以下方法将其读入R...
dat <- as.numeric(readLines("my_large_file"))
我得到了所需的数据结构,但需要很长时间。有什么更快的方法可以达到同样的效果吗?
注意。 1 和 0 的顺序对于保存很重要。 我会考虑在任一 python 或 unix 命令行中的选项,但在 R 中需要最终的数据结构来绘制图形。
【问题讨论】:
-
fread in data.table 非常擅长相对快速地读取大文件