【问题标题】:Difference between UTF encodings?UTF编码之间的区别?
【发布时间】:2012-06-13 19:18:46
【问题描述】:

我有一个简单的问题 - UTF-8UTF-16UTF-32 有什么区别?我知道编码的字符串有不同的大小,但是UTF-16UTF-32 是为了什么?UTF-8 不应该能够正确处理所有语言吗? UTF-7 是如何融入其中的?

编辑

好的,我相对了解整个事情的技术方面,但我仍然看不出我应该在我的应用程序中使用例如UTF-16 而不是UTF-8 的原因。所以我的问题是 - 那么UTF-8 的其他编码的实际用途是什么?

【问题讨论】:

  • 我只是想知道一些 UTF-32 的实际示例。它有什么实际应用吗?

标签: encoding utf


【解决方案1】:

著名的 Joel Spolsky 的这篇文章完美地解释了它:http://www.joelonsoftware.com/articles/Unicode.html

引用:

有数百种传统编码只能正确存储一些码点,而将所有其他码点都变成问号。一些流行的英文文本编码是 Windows-1252(西欧语言的 Windows 9x 标准)和 ISO-8859-1,又名 Latin-1(也适用于任何西欧语言)。但是尝试以这些编码存储俄语或希伯来语字母,你会得到一堆问号。 UTF 7、8、16 和 32 都具有能够正确存储任何代码点的优良特性。

【讨论】:

    【解决方案2】:

    也许Unicode FAQ 会有所帮助?

    有一个比较图表总结了一些差异。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-12-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-24
      • 2014-10-05
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多