【问题标题】:Is each of these one single UTF-8 character?这些都是一个 UTF-8 字符吗?
【发布时间】:2017-10-11 18:50:35
【问题描述】:

我希望能够以编程方式将这些字符插入剪贴板。他们每个人都是一个 UTF-8 字符吗?如果不是,它们是什么编码? 我在寻找拉丁字母下的 UTF-8 字符表 http://www.utf8-chartable.de/unicode-utf8-table.pl 但找不到它们。

Ấ 一个 一个 一个 一个 Ứ Ừ Ử Ữ Ự Ỡ Ợ Ở Ề Ể Ễ

【问题讨论】:

  • 是的,它们都有各自的 Unicode 代码点,从 U+1EA4 开始。

标签: unicode utf-8


【解决方案1】:

您在问题中链接到的字符表仅涵盖 Unicode 的 Basic Latin (U+0000..U+007F) 和 Latin-1 Supplement (U+0080..U+00FF) 块中的代码点。您显示的每个字符都是 Unicode 的 Latin Extended Additional 块 (U+1E00..U+1EFF) 中的代码点。以 UTF-8 编码时,这些字符每个占用 3 个字节,如下所示:

= U+1EA4 = E1 BA A4

= U+1EA6 = E1 BA A6

= u+1EA8 = E1 BA A8

= U+1EAA = E1 BA AA

= U+1EAC = E1 BA AC

= U+1EE8 = E1 BB A8

= U+1EEA = E1 BB AA

= U+1EEC = E1 BB AC

= U+1EEE = E1 BB AE

= U+1EF0 = E1 BB B0

= U+1EE0 = E1 BB A0

= U+1EE2 = E1 BB A2

= U+1EDE = E1 BB 9E

= U+1EC0 = E1 BB 80

= U+1EC2 = E1 BB 82

= U+1EC4 = E1 BB 84

根据您的平台,您可能会也可能不会在剪贴板上存储 UTF-8。例如,在 Windows 上,您只能将文本存储为 ANSI 或 UTF-16(除非您创建自定义剪贴板格式来保存 UTF-8)。

【讨论】:

    猜你喜欢
    • 2012-02-06
    • 2011-04-10
    • 2020-03-07
    • 2015-01-04
    • 2011-08-23
    • 2010-10-08
    • 2015-12-05
    • 1970-01-01
    • 2012-02-28
    相关资源
    最近更新 更多