【发布时间】:2017-12-11 20:58:30
【问题描述】:
在标题行缺少数据集中最后几列的条目的文件上使用 read_tsv 时,我遇到了麻烦。 readr 确实指出了警告/问题的情况,但这似乎与 readr 应该处理这些情况的方式背道而驰,如下所示: https://github.com/tidyverse/readr/issues/189
这个对 read_csv 的调用示例取自上面的链接:
read_csv("a,b\n1,2,3,4")
#> Warning: 1 parsing failure.
#> row # A tibble: 1 x 5 col row col expected actual file expected <int> <chr> <chr> <chr> <chr> actual 1 1 <NA> 2 columns 4 columns literal data file # A tibble: 1 x 5
#>
#> # A tibble: 1 x 2
#> a b
#> <int> <int>
#> 1 1 2
#> Warning message:
#> In rbind(names(probs), probs_f) :
#> number of columns of result is not a multiple of vector length (arg 2)
注意,我使用的是 R v3.4.2 和 readr v1.1.1。根据之前使用 readr 的经验(以及上面的链接),readr 仍应读取缺少标题的列并自动为其分配名称 X1 和 X2。 readr 是否改变了处理这些案件的方式?这是 tibble 的副作用吗?
【问题讨论】:
-
对于
readrgithub 问题似乎是一个更好的问题。相关:github.com/tidyverse/readr/issues/189。任何更改通常都列在NEWS