【发布时间】:2019-05-10 11:06:21
【问题描述】:
我有一个从网上抓取的字符串,如下所示:
"trackingId":"f©9\u0004+L\u001A&\u0013i+T"},{"pendingInvitation":false
如何从字符串中删除杂散字节 <0x85>、<0x9b>、<0x91> 和 <0x87>?
【问题讨论】:
-
您可以对所有不需要的字节 (
unwanted = (b'<0x85>', ...)) 使用“黑名单”,并使用生成器表达式进行过滤:"".join(b for bs in bytestring if b not in unwanted) -
这就是字符串
'<0x85>'吗?如果我查看您问题的来源,我会看到很多有趣的角色。请包含实际字符串作为代码(例如repr(your_string)的输出),而不是引用文本。此外,这看起来不太可能是跟踪 ID 字符串,除非它是二进制的并且您搞砸了编码。
标签: python