【发布时间】:2020-02-26 02:19:35
【问题描述】:
我是这个网站的新手,我在硕士论文计算中积极使用 R。我使用俄语数据并且必须处理很多俄语西里尔字母,但在 Windows 上,问题是它默认不以 UTF-8 编码字符。让我给你举个例子:
Sys.setlocale(locale="Russian")
Encoding(c("Руссгрэйн Холдинг","Сбербанк","Русал","Магнит","Северсталь"))
作为输出,您将得到“未知”。
这对我来说是个问题,因为 stringr 包的许多功能都不起作用。
我尝试了哪些解决方法:
1) 像在 linux 上一样使用 Linux Mint 进行双启动我可以立即使用西里尔字母,而无需设置语言环境等。
2) 对于纯Windows的解决方案,我可以在每次操作字符串时手动设置enc2utf8(),但这很繁琐,需要额外的操作。
总而言之,我想在 Windows 中获得一个解决方案,我可以立即输入 utf8 编码,这样我就不必每次都使用 enc2utf8。
关于直接解决我的问题的 stackoverflow 没有任何问题(它们主要涉及导入带有 utf-8 编码字符的数据表,这不是我的情况)。
【问题讨论】: