【发布时间】:2019-10-17 21:06:57
【问题描述】:
我获得了使用 Scrapy 抓取的数据,该数据保存为编码为 utf-8-sig 的 csv 文件。数据有很多不同的特殊字符:韩文、俄文、中文、西班牙文、...、星号(★)、这个????、这个????...
所以 Scrapy 可以保存,我可以在 Notepad++ 或 CSVFileView 等应用程序上查看这些内容。但是当我使用mydata <- read.csv(<path_to_file>, fileEncoding="UTF-8-SIG", header=FALSE) 在 R 中加载时,我得到了这个错误:
Error in file(file, "rt", encoding = fileEncoding) :
unsupported conversion from 'UTF-8-SIG' to ''
如果我不指定编码,我可以加载,但符号会变成â˜之类的字符,并且第一列标题将附加ï..
我应该选择哪种编码来包含所有字符?
【问题讨论】:
-
@H1 是的,遇到这种特殊字符时会停止加载
-
也许可以试试
read.csv(<path_to_file>, encoding="UTF-8", header=FALSE)- 请注意,这是使用encoding参数而不是fileEncoding参数。 -
@H1 是的,行得通!但后来我的第一个专栏标题附加了
X.U.FEFF.
标签: r utf-8 character-encoding