【问题标题】:Need a list of languages that are supported completely by ASCII encoding [closed]需要 ASCII 编码完全支持的语言列表 [关闭]
【发布时间】:2009-03-31 20:29:03
【问题描述】:

我正在写一篇关于 Unicode 的文章,并讨论这种编码方案相对于 ASCII 等过时方法的优势。

作为我研究的一部分,我正在寻找一个参考,列出可以仅使用 ASCII 支持的字符完全表示的语言。用 Google 追踪它的运气不太好,我想我会利用 SO 的集体知识来看看是否有人有一个合理的列表。

要点:

  • 列出的所有语言都必须能够 使用 ASCII 中可用的字符集完全表示。
  • 我知道这并不全面, 但我最感兴趣的是 最常见的书面语言。

【问题讨论】:

  • 您要求的是不允许使用 Unicode 字符的语言,还是不需要 Unicode 字符的语言? “完全代表”这句话意义不大。甚至 APL 也可以用纯 ASCII 编写。你能定义“完全代表”吗?
  • 你确定你说的是 ASCII 而不是 ISO-8859-1? ASCII 即使是英语也不够用。
  • 让我举个例子。假设您有一个应用程序将文本编码为普通的老式 8 位 ASCII,就像他们在计算机科学课上教我们的一样。我正在寻找此应用不太可能破坏的自然语言列表。
  • 没有普通的老式 8 位 ASCII 这样的东西。 ASCII 一直是并将永远是 7 位。
  • 大多数语言都可以通过特定的 8 位代码页进行合理处理。多语言代码页(例如 850 或 ISO 8859)可以处理指定语言组之间的交换。 8 位代码页的 256 个字符限制不允许在所有语言组或使用超过 256 个字符的语言表示或许多印刷字形表示之间进行互换。

标签: unicode ascii


【解决方案1】:

据我所知,没有一种自然语言可以完全用 ASCII 表示。即使是发明了 ASCII 的语言美国英语也不起作用:一方面,有很多外来词已经融入美国英语语言中,无法用 ASCII 表示,例如 resumé em>,naïve 或可能每个程序员都经常使用的词,schönfinkeln

第二,ASCII 缺少几乎所有印刷字符,如“引号”、各种长度的破折号(- 和 -)、省略号(...)、细空格和宽空格等,所有这些都在美国使用英语。

【讨论】:

  • 是的,尽管挑剔,三个句点是输入省略号的公认标准形式。 Unicode U+2026 HORIZONTAL ELLIPSIS 是一个添加的兼容性字符,以允许往返到将其作为单个字符的旧编码。
  • 谢谢,我不知道。在德语中,这通常是不允许的,尽管每个人都会这样做,当然。不是每个人都像我一样着迷,并且实际上用所有这些印刷字符编写了自己的键盘映射:-)
【解决方案2】:

IIRC 来自我的拉丁语课,拉丁语中的长音符号是后来学习拉丁诗歌中的韵律的人添加的;它们不会被用于日常写作。所以你有拉丁语。

【讨论】:

  • 我永远不会想到拉丁语,但你是对的。也许 OP 应该指定 living 语言。
  • Lingua Latina mortua non est.
【解决方案3】:

鉴于借词,我认为没有任何这样的语言。即使是丑陋的美国人也知道“简历”和“简历”之间的区别。

【讨论】:

  • 好点。我没有考虑过借词的可能性。
【解决方案4】:

我假设您的意思是自然语言并且只有 7 位 ASCII?

在这种情况下,列表非常小。主要是英文。

【讨论】:

    【解决方案5】:

    某些constructed languages(例如InterlinguaIdo)设计为仅使用ASCII 字符。日常使用中的“真实”语言倾向于使用 ASCII 范围之外的字符,至少是外来词。

    【讨论】:

      【解决方案6】:

      不是一种广泛使用的语言,但 Rotokas 只能使用 ASCII 字母编写。见http://en.wikipedia.org/wiki/Rotokas_alphabet

      【讨论】:

      • 还有夏威夷语和斯瓦希里语。我确定还有其他人。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-02-23
      • 2021-07-21
      • 1970-01-01
      • 2011-07-17
      • 1970-01-01
      • 2013-10-28
      相关资源
      最近更新 更多