【发布时间】:2021-11-28 10:04:10
【问题描述】:
我有一个 unicode 字符串,例如“?????????????????? ????????????????”并想将其转换为 ASCII 形式的“暴徒生活”。
我知道我可以在 Python 中实现这一点
import unidecode
print(unidecode.unidecode('???????????????? ????????????????'))
// thug life
但是,这也会关联我想要保留的其他 unicode 字符(例如中文/日文字符、表情符号、重音字符等)。
有没有办法检测这些类型的“艺术”Unicode 字符?
更多示例:
?????????????????? ??????????????????
?????????????????? ??????????????????
?????????????????? ??????????????????
生命的意义
感谢您的帮助!
【问题讨论】:
-
参见。 NFC/NFD/NFKD/NFKC ????
''..normalize()
标签: python-3.x unicode ascii