【问题标题】:Read.csv: some rows are missingRead.csv:缺少某些行
【发布时间】:2015-05-18 03:27:48
【问题描述】:

我使用:

read.csv('....csv', as.is=TRUE, header=TRUE)

第一行有一个标题,没有该行仍然有 72139 行,但我只能读取 72138 行。而且我无法弄清楚为什么 R 会自动省略一行。

我检查了前几行,它们没有问题。

更新: 我尝试了另一个类似的 csv 并且 R 错过了超过 10000 行......然后我在这里找到了答案......read.csv in R doesn't import all rows from csv file

我在 read.csv() 中使用 quote="" 但是你必须小心你的字符变量。

我仍然很好奇,因为其他一些 csv 文件也有双引号,但行数较少(大约 30000),但我之前从未对它们犯过任何错误......有人可以帮我解决这个问题吗?

谢谢

【问题讨论】:

  • 缺少哪一行..是最后一行吗?

标签: r csv


【解决方案1】:

我在 50,000 行的数据集上遇到了同样的问题,只有大约一半是使用 read.csv 导入的。这里和其他论坛中的建议都没有对我有用。立即解决它的是我的顾问建议使用“readr”包中的 read_csv 代替。以下是说明:https://readr.tidyverse.org/

【讨论】:

  • 在你的答案中添加一个例子是一件好事。
【解决方案2】:

如何计算文件中的行数? wc -l?如果有一个空白行(很可能在文件的最后一个),wc 也会包含它。

如果没有,您可以使用write.csv 写出数据框,并使用diff 之类的内容将结果与原始数据文件进行比较,以查看缺少哪一行。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-12-20
    • 2017-11-04
    • 1970-01-01
    • 2018-04-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多