【问题标题】:Entering and viewing Cyrillic strings in R在 R 中输入和查看西里尔字母字符串
【发布时间】:2019-10-24 12:15:01
【问题描述】:

如何在 R 中处理西里尔字符串?

Sys.setlocale("LC_ALL","Polish")

dataset <- data.frame( ProductName = c('ąęćśżźół','тест') )

#Encoding(dataset) <- "UTF-8" #this line does not change anything

View(dataset)

上面的代码导致:

但我想得到我在тест 中输入的内容,而不是序列&lt;U+number&gt;。有什么办法吗?

【问题讨论】:

  • 您可以查看this,尽管我的Sys.setlocale() 不是"ru_RU",并且您的代码对我来说很好。

标签: r string encoding


【解决方案1】:

这对我有用,并在我的数据框中查看西里尔字母测试。 我认为您应该检查您的语言环境是什么(使用sessionInfo)以及它是否支持UTF。

同时检查link 并尝试更改列的编码。

Encoding(dataset$Cyrillic) <- "UTF-8"

【讨论】:

  • 谢谢。改变编码是没有用的。将语言环境更改为俄语仅在使用俄语名称的情况下才有帮助。但它会混淆其他非罗马字母的字符串值。我已经编辑了我的问题以更好地反映我的情况。尽管如此,我总是可以将它分成几部分,并为每个部分使用不同的语言环境。可惜不能轻易做到。例如,SQL Server 可以处理其 nvarchar 变量中的任何变音符号野蛮人标记。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-08-24
  • 1970-01-01
相关资源
最近更新 更多