【发布时间】:2012-10-13 15:37:26
【问题描述】:
我有一个从 Excel 导出的 csv 文档,其中包含英文和非英文(俄文)字母。
我已经设法打开它
CSV.open @tmp, "rb:ISO-8859-1", {col_sep: ";"}
但它读取俄罗斯符号为\xCE\xF1\xF2\xE0\xEB\xFC\xED\xFB\xE5 \xE7\xE0\xEF\xF7 等。
我尝试了“rb:ISO-8859-1:UTF-8”,但得到“ArgumentError:UTF-8 中的无效字节序列”,与 csv.open 无模式运行相同。
如何解决这个问题?另外,我如何找到“模式”参数选项 - 我无法从描述它的文档中理解。
如果重要的话,主要环境是 Ubuntu 服务器。
【问题讨论】:
标签: ruby csv character-encoding multilingual