【发布时间】:2015-06-22 05:29:15
【问题描述】:
我有兴趣在标题名称之前跳过我的数据框的某些行。如何跳过ID_REF 之前的所有行,或者如果ID_REF 不存在,请检查模式ILMN_ 并删除所有保持立即的行,如果不包含#。
# GEOarchive matrix file.
ID_REF 1688628068_A.AVG_Signal 1688628068_A.Avg_NBEADS 1688628068_A.BEAD_STDERR 1688628068_A.Detection Pval
ILMN_1343291 62821.84 135 413.9399 0
ILMN_1343292 3255.167 131 47.76587 0
ILMN_1343293 42924.91 152 539.3026 0
ILMN_1343294 55255.21 100 746.1457 0
【问题讨论】:
-
看起来你的列名比列多。
1688628068_A.Detection Pval是单列吗?此外,如果文件有需要跳过的#,则只需read.table('yourfile.txt', header=TRUE, fill=TRUE)即可读取。 -
@akrun 是的,这是单列
-
一种选择是将文件中的列名更改为
1688628068_A.Detection_Pval并在没有fill=TRUE的情况下读取 -
如果你有其他行没有
#,另一种选择是使用awk,即管道。 `read.table(pipe("awk '/^(ID_REF|ILMN)/{matched = 1}matched { print }' file.txt"), header=TRUE, fill=TRUE) -
如果我想从路径读取文件,我可以使用
read.table(path)