【发布时间】:2020-01-16 21:28:45
【问题描述】:
我已经输入了一个 python3 requests get 命令(不确定这是否是好的措辞),将其转换为 json,并对其进行解析以接收名称:
'Harrison Elementary School \U0001f3eb'
我查了一下,unicode 字符代表学校,Unicode School Character。但是当我打印它时,我得到:
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\U0001f3eb' in position 27: character maps to <undefined>
我真的不在乎有那个 unicode 字符。这对我的目的并不重要。
如何从这个或我遇到的任何字符串中删除该 unicode 字符和任何其他 无效 字符?
【问题讨论】:
-
您是如何以及在哪里打印的?操作系统和终端/IDE 使用很重要。
-
报告 Python 版本...例如,Windows 上的 Python 3.6+ 将在终端窗口中打印所有 Unicode 字符而不会引发异常,但如果字体不支持该字符,则使用了替换字符。
标签: python-3.x unicode string-parsing