【发布时间】:2011-05-02 06:47:21
【问题描述】:
我正在尝试将制表符分隔列表导入 R。
它有 81704 行长。但是,read.table 仅创建 31376。这是我的代码:
population <- read.table('population.txt', header=TRUE,sep='\t',na.strings = 'NA',blank.lines.skip = FALSE)
没有#注释掉任何东西。
这里是前几行:
[1] "NAME\tSTATENAME\tPOP_2009" "Alabama\tAlabama\t4708708" "Abbeville city\tAlabama\t2934" "Adamsville city\tAlabama\t4782"
[5] "Addison town\tAlabama\t711"
当我阅读它时,readLines 给出了正确的数字。
非常感谢任何想法!
【问题讨论】:
-
几个想法:文件中是否有引号 " 或 '?如果是这样,它可能会将换行符解析到其中一个字段中。另一种可能性:是否有任何混合 CR (\r ) 和 LF (\n) 字符?
标签: r