【问题标题】:Error in read.csv with colClasses: scan() expected 'a real' got 'NULL'带有 colClasses 的 read.csv 中的错误:scan() 预期 'a real' 得到 'NULL'
【发布时间】:2012-06-21 22:30:29
【问题描述】:

我正在使用read.csv 读取大型 csv 文件。一些网站建议使用 colClasses 为每一列定义类,以加快导入过程。

t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
scan() expected 'a real', got 'NULL'

classes = c("numeric","integer")

我的一些数据中显然有空值。有没有办法在“数字”或“整数”包含空值的情况下使用 colClasses?此外,有关将大型数据集更快地导入 R 的任何其他技巧都会非常有帮助。我有一个 SQL 数据库中的所有数据,我尝试使用 RODBC,它比 read.csv() 慢得惊人。

【问题讨论】:

  • 最好不要使用变量't',因为它对应于转置函数。 'c' 同上。

标签: r csv import


【解决方案1】:

在调用read.csv 时使用na.strings='NULL'

【讨论】:

  • 这是做什么的?
猜你喜欢
  • 2020-08-29
  • 1970-01-01
  • 1970-01-01
  • 2011-02-17
  • 2021-12-22
  • 1970-01-01
  • 1970-01-01
  • 2022-01-02
  • 2021-06-29
相关资源
最近更新 更多