【发布时间】:2017-06-30 19:57:15
【问题描述】:
如果 UTF-32 是 UCS-4 限制为 17 个平面(1114111 个字符点),需要 21 位,那么第四个字节在做什么?
【问题讨论】:
-
坦率地说:因为它可以,而且在大多数计算机中使用 32 位值很容易。
如果 UTF-32 是 UCS-4 限制为 17 个平面(1114111 个字符点),需要 21 位,那么第四个字节在做什么?
【问题讨论】:
第四个字节就坐在那里,占用空间(用0填充)。
理论上,可以设计 21 位或 24 位交换格式。在实践中,这两者都很尴尬。很少(如果有的话)现代计算机具有 21 位或 24 位数据类型。由于 32 位字很容易使用,因此通常使用它们来存储最大值远小于 231-1 的数值数据类型。
【讨论】: