【问题标题】:Error with specifying colClasses in read.csv在 read.csv 中指定 colClasses 时出错
【发布时间】:2016-03-01 03:00:18
【问题描述】:

我有一个名为“rating.csv”的数据集。数据集如下所示:

rating: 2.97, 3, 3, 3.41, 3.5, 3.5, 4, NULL, NULL, NULL, 3.67

我正在尝试在 read.csv 中指定 colClasses 以加快 csv 文件的读取速度。首先,我像这样创建 colClasses:

classes <- c("double")

然后我用

读取数据集
data <- read.csv('rating.csv', colClasses=classes,
  comment.char="", na.strings='NULL')

但是我收到这个 read.csv 的错误

Error in scan(file, what, nmax, sep, dec, quote, skip, 
 nlines, na.strings,  : scan() expected 'a real', got '"3.67"'

你知道这段代码有什么问题吗?或者除了read.csv之外还有其他方法可以更改数据集colclass的类型吗?

【问题讨论】:

  • 我认为我们需要查看数据集本身。可以发个链接吗?
  • 错误似乎表明最后一列是字符,而不是数字。

标签: r csv read.csv


【解决方案1】:

我认为这意味着您的数据是字符串格式,而不是数字/双精度/csv 格式中可用的任何选项。

【讨论】:

    猜你喜欢
    • 2011-02-17
    • 2011-09-30
    • 1970-01-01
    • 2014-12-04
    • 1970-01-01
    • 2012-06-21
    相关资源
    最近更新 更多