【发布时间】:2018-08-22 13:21:09
【问题描述】:
我有一个 UTF-8 编码的 dbf 文件。当我在 R 中打开它时,在带有 CP1250 字符集的 Windows 上使用read.dbf()(包foreign),字符被损坏:
require(foreign)
x <- read.dbf('file.dbf')
Sys.setlocale()
# "LC_COLLATE=Czech_Czech Republic.1250;LC_CTYPE=Czech_Czech Republic.1250;LC_MONETARY=Czech_Czech Republic.1250;LC_NUMERIC=C;LC_TIME=Czech_Czech Republic.1250"
我想知道我是否应该设置不同的语言环境,正如这里的一些答案所建议的那样,但它在 Win XP 上不起作用 - 当我尝试将语言环境设置为 UTF-8 时,它显示“操作系统报告请求设置无法采用“Czech_Czech Rebublic.UTF8”的语言环境”。
我认为设计上不需要设置新的语言环境(还有see here) - 它应该是函数read.dbf(),或者可能是一些后处理,以处理字符集而不必切换整个 R 系统的语言环境.
你知道怎么做吗?
【问题讨论】: