【发布时间】:2013-09-09 21:30:36
【问题描述】:
这是作业。我不是在寻找代码只是讨论,关于如何进行的高级建议。
我目前正在处理一项任务,我们将文件中的 UTF-16 字符转换为输出文件中的 UTF-32,反之亦然。该作业说,第一步是处理仅包含少于 10 位字符的文件,但我很难过。这是我们的第一个任务,虽然我使用过 C++,但从未真正使用过 C。
I have been reading the RFC about such conversions (S.2.1) 我觉得我理解得很好。我知道 UTF-32 字符实际上是 10 位,前面是 6 位定义它的组成(我相信 110110 表示第一对 16 位,110111 表示第二对“32”)。 UTF-16 字符是否以 6 个前导 0 开头?
还是 UTF-16 字符小于 10 位,一旦你遇到 10 位字符,你就知道你遇到了 UTF-32 位字符?
我想我真正的问题是当它可以是 8、16 等时,“10 位字符”是什么意思。但是对我提到的任何内容的任何见解都会很棒!
【问题讨论】:
-
也许可以显示作业所说的确切文字?按照你的措辞,这并没有真正的意义。
-
"编写一个 C 程序,它将读取 UTF-32 或 UTF-16 格式的文件,并以另一种格式输出相同的文件。" 10 位部分只是说“正确处理仅包含小于 10 位字符的文件。”
-
听起来像是问你教授的问题。它的措辞很糟糕,对我来说也没有任何意义。
-
+1 为什么人们不赞成这个?发帖人对工作的性质诚实,并没有要求完整的答案,而是寻求建议。
-
在我看来,教授希望你首先研究一种不超过 1023 个不同字符的语言。但是你需要问你的教授。