【发布时间】:2016-07-12 02:43:45
【问题描述】:
这个问题困扰了一年。我的 R 无法打开包含简体 中文 字符的 csv 文件。我相信数据编码为GBK。我有三台不同语言和操作系统的电脑,打开同一个中文 csv 文件时,结果混合结果。有人能告诉我为什么结果不同吗?
- (1)Windows+English OS+English R and R studio:无法读取我的 csv,即使我将其编码为 UTF8、GBK,而您将其命名为中文编码。
(2) Mac+EnglishOS+English R: ABLE 读取中文csv而不强制编码(更新:我重新安装操作系统到El Caption后,它无法打开我的csv 正确)
(3) Windows+中文操作系统,+中文R:ABLE读取csv而不强制编码或gbk
- (4) Windows+英文操作系统,+中文R:无法
- (5) Ubuntu 英文操作系统,英文 R:ABLE
- 在windows case(中英文操作系统)下,notebook可以正确打开csv,但是在英文case下不能打开excel。当我无法用 excel 打开我的 csv 时,我的 r 也不能。
- 如果我通过 Google 表格聚合 csv,我的 excel 可以打开我的 csv,但 R 仍然不行。
编码在 R 中是如何工作的,为什么结果会随着 OS 语言而变化?
read.csv(...,encoding=)
【问题讨论】:
-
感谢您注意到
gbk是其中一种可能性。我在打开从网上银行下载的简体中文CSV文件时遇到问题,我试过latin1,我试过iso-8859-1,我试过cp1252,都无济于事。但是gkb只是完成了这项工作!