【发布时间】:2014-11-11 12:46:22
【问题描述】:
所以我一直在关注 unicode 和 utf-8,因为我有一个脚本可以从网络上抓取图像及其标题。效果很好,除非他们的标题有特殊字符(例如 Jökulsárlón。)
它以 unicode 的形式出现:-
J\\xc3\\xb6kuls\\xc3\\xa1rl\\xc3\\xb3n
所以我想要一种方法将该字符串转换为纯文本 - 是否将它们转换为最接近的“普通”字母(如纯 o 而不是 ö)或打印那些实际符号(而不是 \xc3 等)我已经尝试了十亿种不同的方式,但我一直在阅读的很多东西在 python 3 中对我没有用。
提前致谢
【问题讨论】:
标签: python python-3.x unicode utf-8