【问题标题】:What encoding is this and how can I decode it?这是什么编码,我该如何解码?
【发布时间】:2011-12-04 13:52:23
【问题描述】:

我有一个旧项目文件,其中包含特殊字符被破坏的葡萄牙语翻译:

error.text.required=\u00C9 necess\u00E1rio o texto.
error.categoryid.required=\u00C9 necess\u00E1ria a categoria.
error.email.required=\u00C9 necess\u00E1rio o e-mail. 
error.email.invalid=O e-mail \u00E9 inv\u00E1lido.
error.fuel.invalid=\u00C9 necess\u00E1rio o tipo de combust\u00EDvel.
error.regdate.invalid=\u00C9 necess\u00E1rio ano de fabrica\u00E7\u00E3o.
error.mileage.invalid=\u00C9 necess\u00E1ria escolher a quilometragem.
error.color.invalid=\u00C9 necess\u00E1ria a cor.

你能告诉我如何解码文件以使用常见的葡萄牙语字母吗?

谢谢

【问题讨论】:

    标签: text translation decode encode


    【解决方案1】:

    “\u”是 unicode 的前缀。您可以“按原样”使用字符串,并且您将在输出中显示变音符号。 python 代码类似于:

    print u"\u00C9 necess\u00E1rio o texto."
    

    哪个输出:

    É necessário o texto.

    否则,您需要将它们转换为 ASCII 等价物。您可以进行简单的查找/替换。不久前,我最终编写了一个用于转换罗马尼亚变音符号的函数,但我有动态字符串进来......

    【讨论】:

      【解决方案2】:

      我觉得这是 unicode 吗?

      \u = 前缀 unicode 字符

      00E1 = unicode 的 2 字节数字的十六进制代码。

      不确定格式是什么 - 我会问 sencer,但我会尝试这种方法来解码它。


      找到了;) http://www.fileformat.info/info/unicode/char/20/index.htm

      查看带有源代码的表格。这可以是 C++ 源文件。这是您在源代码中提供 unicode 字符的方式。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2019-04-28
        • 2011-03-19
        • 2017-07-28
        • 1970-01-01
        • 1970-01-01
        • 2020-05-24
        相关资源
        最近更新 更多