同一份源代码,源文件编码格式为UTF-8:

    string tmp = "";
    for(int i=0;i<tmp.size();++i)
    {
        printf("%0x ",tmp[i]);
    }

在MSVC编译器下输出

ffffffce ffffffd2

在MingW编译器下输出

ffffffe6 ffffff88 ffffff91

很明显,MSVC对中文采用GB2312或GBK编码,即使用两个字节表示汉字

而MingW对中文采用UTF-8编码,即使用三个字节存储汉字。

 

另外注意的是:

源文件采取何种编码方式只影响编译器的解析过程,而不会影响解析完毕后的编译过程。

Windows的终端在打印GB2312或GBK编码的中文时显示正确;而打印UTF-8编码的中文时会乱码。

 

相关文章:

  • 2021-07-25
  • 2021-06-22
  • 2021-11-20
  • 2021-07-16
  • 2022-12-23
  • 2022-01-18
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-06-06
  • 2021-09-05
  • 2022-01-15
  • 2021-12-15
相关资源
相似解决方案