【发布时间】:2011-11-11 18:34:08
【问题描述】:
我有一个 .csv 文件:example.csv 包含 8000 列 x 40000 行。 csv 文件的每一列都有一个字符串标题。所有字段都包含 0 到 10 之间的整数值。当我尝试使用 read.csv 加载此文件时,结果非常慢。当我添加一个参数nrow = 100时,它也很慢。我想知道是否有办法加速 read.csv,或者使用其他函数而不是 read.csv 将文件作为矩阵或 data.frame 加载到内存中?
提前致谢。
【问题讨论】:
-
请分享您用于 read.csv 的代码 - 有很多选项可以提高性能,请参阅 ?read.table