1. UNICODE个人感觉分广义和狭义, 广义的UNICODE包括UTF8, UCS2, UCS4, 而狭义的UNICODE(主要是Windows平台)就是指UCS2。

2. UNICODE统一为两个字节,增加了网络传输及存储的开销。

3. UTF8对英文字符还是1个字节存储,只对其他语言字符用多个字节存储(2-6个字节)。

4. UNCIODE与UTF8之间可相互转换,C++11中的操作如下:

 

std::codecvt_utf8 封装了UTF8相关的编码转换
std::codecvt_utf16 封装了UCS2相关的编码转换
std::codecvt_utf8_utf16 封装了UTF8与UCS2的编码转换

 

5. 低字节在低地址的为小端;高字节在低地址的为大端。

6. 系统的大小端和CPU架构体系相关联, 比如说X86是小端, PowPC是大端,ARM则是可控制(默认也是小端)。

7. 程序判断大小端:

  bool IsLittleEndian()  {  int i=1;  return (*(char *)&i == 1); }

8. 栈存储数据int类型整数1的结构如下:

                       字符编码与大小端

 

相关文章:

  • 2021-07-28
  • 2021-04-15
  • 2021-06-12
  • 2021-09-05
  • 2022-01-30
  • 2021-10-17
猜你喜欢
  • 2022-02-07
  • 2021-07-06
  • 2022-12-23
  • 2021-07-16
  • 2021-06-30
  • 2022-12-23
  • 2021-12-19
相关资源
相似解决方案