【发布时间】:2020-04-19 07:24:12
【问题描述】:
不间断空格打印为空格,但在内部处理为\xa0。如何一次删除所有这些字符?
到目前为止,我已经直接替换了它:
text = text.replace('\u202f','')
text = text.replace('\u200d','')
text = text.replace('\xa0','')
但是每次我从外部来源抓取文本句子时,这些字符都是不同的。如何一次将其全部删除?
【问题讨论】:
标签: python-3.x string nlp python-unicode unicode-string