【问题标题】:RStudio character encoding issue: quotation marks replaced by \x92RStudio 字符编码问题:引号替换为 \x92
【发布时间】:2015-05-17 18:59:46
【问题描述】:

我正在阅读.csv 一个包含一些自然出现的文本的文件。有时在文本中,' 用作撇号,有时使用 ' 代替(参见this table 的第 2 行和第 6 行)。

在我的笔记本电脑上读取 RStudio 中的文件时,我没有任何问题(' 和 ' 都在文本中)。但是,在 Rstudio 服务器(EC2 实例)中读取文件时,所有的 ' 都被 \x92 替换,这是一个问题。

this question 的第一个答案的第一个要点之后,我尝试通过 RStudio 服务器中的全局选项菜单更改编码:Unicode、UTF-8、UTF-16、Windows-1252、ISO8859-1等。

不幸的是,无论我选择什么,每次都会出现同样的问题。

非常感谢您的任何帮助。

【问题讨论】:

    标签: r character-encoding rstudio rstudio-server


    【解决方案1】:

    我刚刚找到了一个解决方案,所以我正在回答我自己的问题:

    不知何故,我尝试通过 RStudio 服务器中的全局选项菜单设置编码对 read.csv 没有任何影响(我认为它应该默认使用全局选项中指定的编码 getOption("encoding"),但它似乎并非总是如此……)

    无论如何,通过使用 fileEncoding 参数直接在 read.csv 中指定编码类型,并通过检查数据,我可以看到这次我的不同编码选择产生了影响。经过几次试验,我发现“Windows-1252”给了我想要的东西。

    【讨论】:

      猜你喜欢
      • 2019-07-02
      • 2017-06-03
      • 1970-01-01
      • 2021-03-21
      • 2019-07-18
      • 1970-01-01
      • 2021-11-19
      • 2011-04-12
      • 1970-01-01
      相关资源
      最近更新 更多