【问题标题】:Ruby CSV parsing from Excel with multilingual document使用多语言文档从 Excel 解析 Ruby CSV
【发布时间】:2012-10-13 15:37:26
【问题描述】:

我有一个从 Excel 导出的 csv 文档,其中包含英文和非英文(俄文)字母。

我已经设法打开它

CSV.open @tmp, "rb:ISO-8859-1", {col_sep: ";"}

但它读取俄罗斯符号为\xCE\xF1\xF2\xE0\xEB\xFC\xED\xFB\xE5 \xE7\xE0\xEF\xF7 等。 我尝试了“rb:ISO-8859-1:UTF-8”,但得到“ArgumentError:UTF-8 中的无效字节序列”,与 csv.open 无模式运行相同。

如何解决这个问题?另外,我如何找到“模式”参数选项 - 我无法从描述它的文档中理解。

如果重要的话,主要环境是 Ubuntu 服务器。

【问题讨论】:

    标签: ruby csv character-encoding multilingual


    【解决方案1】:

    尝试使用这种格式

    r:ISO-8859-15:UTF-8
    

    【讨论】:

    • 谢谢。保存数据时,它看起来对客户的语言环境有一些调整。对于几个文件 CP-1251 工作正常。不确定如何测试文件以猜测原始编码。
    猜你喜欢
    • 1970-01-01
    • 2017-06-24
    • 2015-03-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-27
    • 1970-01-01
    • 2011-02-15
    相关资源
    最近更新 更多