【发布时间】:2016-11-13 05:09:12
【问题描述】:
我的网站上有这样显示的文字:o¨ 而不是 ö
我从 CMS 中提取了文本并分析了它的十六进制值:
- 正确显示的 ö 具有
c3 b6- UTF-8 - 显示不正确的ö有
6f cc 88
我不知道这是什么编码。识别编码的好方法是什么?
【问题讨论】:
标签: encoding character-encoding
我的网站上有这样显示的文字:o¨ 而不是 ö
我从 CMS 中提取了文本并分析了它的十六进制值:
c3 b6 - UTF-86f cc 88
我不知道这是什么编码。识别编码的好方法是什么?
【问题讨论】:
标签: encoding character-encoding
6F 是“o”的 UTF-8 (ASCII) 编码,没什么特别的。CC 88 是 U+0308, COMBINING DIAERESIS 的 UTF-8 编码。
您只是在查看 o-umlaut 的 分解 形式。组合分叉字符应该在视觉上呈现,嗯,组合与前一个字符。如果您的系统不这样做,则意味着它没有正确处理 Unicode,和/或您选择的字体有些损坏。也许您必须将您的字符串normalise 转换为组合的 Unicode 形式,而不是让您的系统正确处理它。
【讨论】: