【发布时间】:2018-01-07 01:23:00
【问题描述】:
我正在处理来自所有可能的欧洲语言的数据。 R 不能正确识别特殊字符,例如"ć" 而不是 "c"。
> "ć"
[1] "c"
我已经多次遇到这种情况并找到了解决方法(read.csv,其他函数有选项encoding),但这并不能解决我的问题,但是如上所述。我进一步尝试了
> a <- "ć"
> Encoding(a)
[1] "unknown"
并将encoding 的options 设置为“UTF-8”,但没有成功。在实际分配字符之前,有没有办法告诉 R 从控制台读取什么编码?
【问题讨论】:
-
您可以更改您的区域设置吗?我在我的系统上看到了
"ć"的预期输出。
标签: r encoding character-encoding character utf