【发布时间】:2018-06-24 12:35:54
【问题描述】:
我知道如何删除字符串中不需要的字符,例如笑脸等。但是,像德语这样的一些语言也有特殊字符。
这是我当前的代码:
import unicodedata
string = "süß ????????????"
uni_str = str(unicodedata.normalize('NFKD', \
string).encode('ascii','ignore'))
是否有可能保留德语特殊字符但删除其他不需要的字符,例如像????????????的笑脸?这样uni_str 将在末尾保留字母“süß”?
目前,笑脸将被删除,但德语角色要么被转换为其他人声,要么也被删除。
示例中的笑脸只是示例,可以是任何不受欢迎的角色。
我正在使用 Python 3.6 和 Windows 10
【问题讨论】:
标签: python python-3.x unicode ascii python-module-unicodedata