【发布时间】:2017-07-02 05:14:55
【问题描述】:
我正在尝试从文本字符串中删除一些十六进制(例如\xc3)。
我计划使用正则表达式来帮助摆脱这些。
这是我的代码:
import re
tweet = 'b"[/Very seldom~ will someone enter your life] to question\xc3\xa2\xe2\x82\xac\xc2\xa6"'
tweet1 = re.sub(r'\\x[a-f0-9]{2}', '', tweet)
print(tweet1)
但是,我实际上并没有删除输出,而是得到了十六进制的编码版本。这是我的输出:
b"[/Very seldom~ will someone enter your life] to questionââ¬Â¦ "
有人知道我怎样才能摆脱那些十六进制字符串吗?...在此先感谢。
【问题讨论】: