【发布时间】:2016-03-01 03:00:18
【问题描述】:
我有一个名为“rating.csv”的数据集。数据集如下所示:
rating: 2.97, 3, 3, 3.41, 3.5, 3.5, 4, NULL, NULL, NULL, 3.67
我正在尝试在 read.csv 中指定 colClasses 以加快 csv 文件的读取速度。首先,我像这样创建 colClasses:
classes <- c("double")
然后我用
读取数据集data <- read.csv('rating.csv', colClasses=classes,
comment.char="", na.strings='NULL')
但是我收到这个 read.csv 的错误
Error in scan(file, what, nmax, sep, dec, quote, skip,
nlines, na.strings, : scan() expected 'a real', got '"3.67"'
你知道这段代码有什么问题吗?或者除了read.csv之外还有其他方法可以更改数据集colclass的类型吗?
【问题讨论】:
-
我认为我们需要查看数据集本身。可以发个链接吗?
-
错误似乎表明最后一列是字符,而不是数字。