【发布时间】:2010-10-12 11:56:18
【问题描述】:
我有一个 ASCII 文件,其中包含一个 EM Dash(— 或 HTML 中的 —)。十六进制值为 0x97。当我们通过一个应用程序传递这个文件时,它以 UTF-8 格式到达,并将字符转换为 0xC297,即 HTML 中的—。但是,当我们通过不同的应用程序传递此文件时,它会将字符转换为 0xE28094 或 —。
什么会导致这些应用程序以不同的方式转换这些字符?可能是代码页设置?
【问题讨论】: