【发布时间】:2015-07-22 21:25:45
【问题描述】:
如何生成一个 UTF-8 字符序列,其中每个字符由多个字节表示,并且每个字符都是从具有多字节表示的所有字符集中选择的?
我正在尝试测试我的应用程序如何处理带有多字节字符的 UTF-8。谢谢。
【问题讨论】:
-
好吧,我要问:多字节字符是什么?拉丁1范围之外的任何东西?还是您在谈论多个 UTF-8 字节?或者 UTF-16 代码单元?并不是说您的问题是主题。
-
我的意思是 UTF-8 字符序列,其中每个字符由多个字节表示。对不起,如果这是题外话。我在网上搜索了一个模块来执行此操作,但找不到。我重新表述了这个问题。
-
这涵盖了 ASCII 范围之外的所有内容,因此代码点 U+0080 到
sys.maxunicode。为什么不直接使用random模块来生成这些?
标签: python unicode utf-8 internationalization