【发布时间】:2009-07-30 05:57:57
【问题描述】:
我必须读取一个带有 UTF-8 编码的 Unicode 文本文件,并且必须将此数据写入另一个文本文件。该文件在行中有制表符分隔的数据。
我的阅读代码是不支持 unicode 的 C++ 代码。我正在做的是在string/char* 中逐行读取文件并将该字符串按原样放入目标文件。我无法更改代码,因此不欢迎提出代码更改建议。
我想知道的是,在逐行读取时,我是否会在一行中遇到 NULL 终止字符('\0'),因为它是 unicode 并且一个字符可以跨越多个字节。
我的想法是,很有可能在一行中遇到 NULL 终止字符。你的想法?
【问题讨论】:
标签: c++ unicode utf-8 text-files