【发布时间】:2012-06-21 22:30:29
【问题描述】:
我正在使用read.csv 读取大型 csv 文件。一些网站建议使用 colClasses 为每一列定义类,以加快导入过程。
t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got 'NULL'
classes = c("numeric","integer")
我的一些数据中显然有空值。有没有办法在“数字”或“整数”包含空值的情况下使用 colClasses?此外,有关将大型数据集更快地导入 R 的任何其他技巧都会非常有帮助。我有一个 SQL 数据库中的所有数据,我尝试使用 RODBC,它比 read.csv() 慢得惊人。
【问题讨论】:
-
最好不要使用变量't',因为它对应于转置函数。 'c' 同上。