【问题标题】:gsub error message when addressing column in dataframe in RStudio在 RStudio 中寻址数据框中的列时出现 gsub 错误消息
【发布时间】:2018-09-21 11:04:33
【问题描述】:

几天以来,我不时在 RStudio 中收到以下错误消息,但无法弄清楚是什么原因造成的。

当我在控制台窗口中写入以寻址 data.frame 后跟 $ 以寻址 data.frame 中的特定列(例如df$SomeVariable)时,控制台窗口中将显示以下消息并打印出来我输入的每个字母都结束

Error in gsub(reStrip, "", completions, perl = TRUE) :
 input string 38 is invalid UTF-8

错误信息没有任何实际作用。除了变量名的自动完成之外,一切都很好。 我在 Windows 计算机上使用 R 版本 3.4.4 和 RStudio 版本 1.0.143。在我目前正在处理的 R 脚本中,我不使用 gsub 或任何其他“字符串”或正则表达式函数。该问题出现在各种 data.frames 和 data.frames 中的各种类型的变量(数字、整数、日期、因子等)中。各种软件包也会发生这种情况。目前,我正在使用包 readr、dplyr、plm、lfe、readstata13、infuser 和 RPostgres 的组合。关闭 RStudio 并再次打开后问题会消失一段时间,但工作一段时间后会再次出现。

有谁知道这可能是什么原因以及如何解决它?

【问题讨论】:

  • 你从哪里得到 df/你能告诉我们你最初是如何导入它的吗?
  • 您找到问题的原因了吗?我也有同样的问题...

标签: r rstudio


【解决方案1】:

前几天我也遇到了同样的问题。我做了一些研究,发现当您导入数据集时,您可以更改编码。将编码更改为“latin1”,也许这可以解决您的问题。对不起,我的英语很差,我来自南美洲。希望它有效。

【讨论】:

  • @Emil 我遇到了同样的问题,encoding = 'Latin-1' 修复了它。谢谢。顺便说一句,你的英语很好。 ??
  • 成功了,谢谢。如果您使用 read_csv 并且文件编码为 ISO-8859-1,则代码将为:read_csv("file.csv", locale = locale(encoding = "Latin1")
  • 我重命名了罪魁祸首列,去掉了德语字母,问题就解决了。
猜你喜欢
  • 1970-01-01
  • 2012-05-26
  • 2019-03-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-05-20
  • 2020-02-01
  • 2017-10-16
相关资源
最近更新 更多