【发布时间】:2020-10-02 13:57:39
【问题描述】:
我正在尝试将一个大文件读入 R,该文件由“非”符号 (¬) 分隔。我通常做的是使用Text Edit将此符号更改为分号,并将其保存为csv文件,但此文件太大,当我尝试这样做时我的计算机不断崩溃。我尝试了以下选项:
my_data <- read.delim("myfile.txt", header = TRUE, stringsAsFactors = FALSE, quote = "", sep = "\t")
这会导致数据框只有一行。我知道,这是有道理的,因为我的文件不是由制表符分隔,而是由非符号分隔。但是,当我尝试将 sep 更改为 ¬ 或 \¬ 时,我收到以下消息:
Error in scan(file, what = "", sep = sep, quote = quote, nlines = 1, quiet = TRUE, :
invalid 'sep' value: must be one byte
我也试过
my_data <- read.csv2(file.choose("myfile.txt"))
和
my_data <- read.table("myfile.txt", sep="\¬", quote="", comment.char="")
得到相似的结果。我搜索了与我类似的选项,但他的分隔符并不常用。
【问题讨论】:
-
先用gsub,然后保存文件再重新打开呢?例如用“;”替换非符号。 my_data
-
您是否尝试过双转义字符(在 R 中通常需要) - 即
sep="\\¬"? -
@AndrewGustar 试过了,得到了同样的信息: 扫描错误(文件,what = "",sep = sep,quote = quote,nlines = 1,quiet = TRUE,:无效的'sep' value: 必须是一个字节
标签: r