【发布时间】:2017-08-19 11:35:00
【问题描述】:
我一直在尝试导入以下分号分隔的文件:
# word len;freq;mean;sens;npos;u;orthon;freqn;bgp WN000000
fiber "5;8.671;1;5;1;0;5;6.1;0;-1" 10000000
clad "4;6.78;2;2;1;1;8;7.84;2026;-1" 10000000
tucker "6;8.103;2;3;2;0.91829583405449;7;5.5;4547;-1" 10000000
我尝试了read.csv 和data.table::fread,但都没有成功。 read.csv 识别出一些标题,实际值都在第一列下:
X..word.len freq mean sens npos u orthon freqn bgp.WN000000
1 fiber\t5;8.671;1;5;1;0;5;6.1;0;-1\t10000000 NA NA NA NA NA NA NA NA
2 clad\t4;6.78;2;2;1;1;8;7.84;2026;-1\t10000000 NA NA NA NA NA NA NA NA
3 tucker\t6;8.103;2;3;2;0.91829583405449;7;5.5;4547;-1\t10000000 NA NA NA NA NA NA NA NA
fread 识别第一列,但将所有其他列合并为一个。
X..word len.freq.mean.sens.npos.u.orthon.freqn.bgp WN000000
1 fiber 5;8.671;1;5;1;0;5;6.1;0;-1 10000000
2 clad 4;6.78;2;2;1;1;8;7.84;2026;-1 10000000
3 tucker 6;8.103;2;3;2;0.91829583405449;7;5.5;4547;-1 10000000
有人可以帮忙吗?
【问题讨论】:
-
这些都不能复制/粘贴到 R 中。请出示您的原始文本文件。
-
你使用
sep=";"和read.csv吗? -
@G5W:我做到了。该命令的问题在于,实际值放在第一列,并且没有正确分布在标题中。
-
@RomanLuštrik:我现在就修。
标签: r csv data.table fread read.csv