【发布时间】:2012-03-20 15:01:22
【问题描述】:
我有一个带有# 符号作为分隔符的数据文件,我想用read.file 命令读取它。
首先;这是一个大数据文件,我不想更改分隔符,因为:
- 使用数据中已经存在的不同分隔符的风险(注意:可以检查,但第 2 点使这有点复杂)
- 我希望这些数据文件更多,所有
#符号作为分隔符,所以我不想每次想再次读取这些文件时都更改数据文件
所以我假设我可以使用read.file 命令的sep 参数。但正如我预期的那样,# 标志并没有奏效。仅读取第一列。我尝试了一些不同的分隔符,除了# 符号外,一切正常。请参阅下面的一些示例,包括 # 分隔符。
文件如下:
H1#H2#H3
a#b#c
d#e#f
R 中的代码在我更改分隔符的同一文件中执行,包括结果。对于=、|、@ 和$,它工作正常,但不适用于#...
> read.table(file='test_data.dat', check.names=F, sep='=', header=T)
H1 H2 H3
1 a b c
2 d e f
> read.table(file='test_data.dat', check.names=F, sep='|', header=T)
H1 H2 H3
1 a b c
2 d e f
> read.table(file='test_data.dat', check.names=F, sep='@', header=T)
H1 H2 H3
1 a b c
2 d e f
> read.table(file='test_data.dat', check.names=F, sep='$', header=T)
H1 H2 H3
1 a b c
2 d e f
> read.table(file='test_data.dat', check.names=F, sep='#', header=T)
H1
1 a
2 d
有人可以帮我解决这个问题吗? 这是一个已知的错误'?有解决办法吗?
提前感谢您的帮助!
【问题讨论】:
标签: r read.table