【发布时间】:2013-06-05 19:17:04
【问题描述】:
有没有一种标准的,最好是 Pythonic 的方法来将 &#xxxx; 表示法转换为正确的 unicode 字符串?
例如,
מפגשי
应转换为:
מפגשי
使用字符串操作可以很容易地做到这一点,但我想知道是否有一个标准库。
【问题讨论】:
-
提示:该符号称为"numeric character reference"。
-
+1 @JoachimSauer,谢谢,更新了标题。
-
@AshwiniChaudhary:那个是关于一个非常具体的案例(UTF-16 代码点编码为字符),Jared:那个是关于 named 字符引用(可能答案仍然适用,但我不知道)。