【发布时间】:2009-03-31 20:29:03
【问题描述】:
我正在写一篇关于 Unicode 的文章,并讨论这种编码方案相对于 ASCII 等过时方法的优势。
作为我研究的一部分,我正在寻找一个参考,列出可以仅使用 ASCII 支持的字符完全表示的语言。用 Google 追踪它的运气不太好,我想我会利用 SO 的集体知识来看看是否有人有一个合理的列表。
要点:
- 列出的所有语言都必须能够 使用 ASCII 中可用的字符集完全表示。
- 我知道这并不全面, 但我最感兴趣的是 最常见的书面语言。
【问题讨论】:
-
您要求的是不允许使用 Unicode 字符的语言,还是不需要 Unicode 字符的语言? “完全代表”这句话意义不大。甚至 APL 也可以用纯 ASCII 编写。你能定义“完全代表”吗?
-
你确定你说的是 ASCII 而不是 ISO-8859-1? ASCII 即使是英语也不够用。
-
让我举个例子。假设您有一个应用程序将文本编码为普通的老式 8 位 ASCII,就像他们在计算机科学课上教我们的一样。我正在寻找此应用不太可能破坏的自然语言列表。
-
没有普通的老式 8 位 ASCII 这样的东西。 ASCII 一直是并将永远是 7 位。
-
大多数语言都可以通过特定的 8 位代码页进行合理处理。多语言代码页(例如 850 或 ISO 8859)可以处理指定语言组之间的交换。 8 位代码页的 256 个字符限制不允许在所有语言组或使用超过 256 个字符的语言表示或许多印刷字形表示之间进行互换。