【问题标题】:How to identify encoding from hex values?如何从十六进制值中识别编码?
【发布时间】:2016-11-13 05:09:12
【问题描述】:

我的网站上有这样显示的文字: 而不是 ö

我从 CMS 中提取了文本并分析了它的十六进制值:

  • 正确显示的 ö 具有 c3 b6 - UTF-8
  • 显示不正确的ö有6f cc 88

我不知道这是什么编码。识别编码的好方法是什么?

【问题讨论】:

    标签: encoding character-encoding


    【解决方案1】:

    6F 是“o”的 UTF-8 (ASCII) 编码,没什么特别的。
    CC 88U+0308, COMBINING DIAERESIS 的 UTF-8 编码。

    您只是在查看 o-umlaut 的 分解 形式。组合分叉字符应该在视觉上呈现,嗯,组合与前一个字符。如果您的系统不这样做,则意味着它没有正确处理 Unicode,和/或您选择的字体有些损坏。也许您必须将您的字符串normalise 转换为组合的 Unicode 形式,而不是让您的系统正确处理它。

    【讨论】:

    • 谢谢!好吧,我的系统是浏览器(如果是 Firefox、IE 则为当前版本——我认为在 Chrome 中它可以工作,现在不确定了)。使用的字体是谷歌字体 - 所以我怀疑系统或字体有问题。 // 实际上似乎是字体的问题,我找到了答案:stackoverflow.com/a/19706263/603569
    猜你喜欢
    • 2016-04-17
    • 1970-01-01
    • 1970-01-01
    • 2019-11-22
    • 1970-01-01
    • 2013-06-10
    • 2015-12-29
    • 1970-01-01
    • 2014-02-18
    相关资源
    最近更新 更多