【问题标题】:How to set the default typing character encoding in R on Windows?如何在 Windows 上的 R 中设置默认的打字字符编码?
【发布时间】:2020-02-26 02:19:35
【问题描述】:

我是这个网站的新手,我在硕士论文计算中积极使用 R。我使用俄语数据并且必须处理很多俄语西里尔字母,但在 Windows 上,问题是它默认不以 UTF-8 编码字符。让我给你举个例子:

Sys.setlocale(locale="Russian")
Encoding(c("Руссгрэйн Холдинг","Сбербанк","Русал","Магнит","Северсталь"))

作为输出,您将得到“未知”。

这对我来说是个问题,因为 stringr 包的许多功能都不起作用。

我尝试了哪些解决方法:

1) 像在 linux 上一样使用 Linux Mint 进行双启动我可以立即使用西里尔字母,而无需设置语言环境等。

2) 对于纯Windows的解决方案,我可以在每次操作字符串时手动设置enc2utf8(),但这很繁琐,需要额外的操作。

总而言之,我想在 Windows 中获得一个解决方案,我可以立即输入 utf8 编码,这样我就不必每次都使用 enc2utf8。

关于直接解决我的问题的 stackoverflow 没有任何问题(它们主要涉及导入带有 utf-8 编码字符的数据表,这不是我的情况)。

【问题讨论】:

    标签: r windows encoding


    【解决方案1】:

    就目前而言,Windows 10 的最佳选择是每次使用 UTF-8 编码字符串时都使用 enc2native。这也将在 RStudio 查看器的活跃使用情况下受益。例如,查看器在 10 秒内对 UTF-8 编码的列进行排序,而如果该列是本机编码的,它可以在 2 秒内对整个列进行排序(具有 +200000 行的表)。

    【讨论】:

      猜你喜欢
      • 2016-03-13
      • 1970-01-01
      • 2016-02-20
      • 2010-10-02
      • 1970-01-01
      • 2011-01-06
      • 2021-04-03
      • 2011-12-04
      • 2014-04-23
      相关资源
      最近更新 更多