需求:替换文本字符串中的 ‘<’ 或者 ‘>’ ,使用 html.escape() 函数

import html
s="<div>你好<div>"
print(html.escape(s))   # &lt;div&gt;你好&lt;div&gt;

需求:含有编码值的原始文本,需要手动去做替换(较常见)

from html.parser import HTMLParser
d="&lt;div&gt;你好&lt;div&gt;"
p=HTMLParser()
print(p.unescape(d))    # <div>你好<div>

需求:如果你正在处理的是ASCII文本,并且想将非ASCII文本对应的编码实体嵌入进去

#  可以给某些I/O函数传递参数 errors='xmlcharrefreplace' 来达到这个目
b = 'Spicy Jalapeño'
print(b.encode('ascii', errors='xmlcharrefreplace'))   # b'Spicy Jalape&#241;o'

 

相关文章:

  • 2021-09-01
  • 2021-11-24
  • 2021-07-09
  • 2021-10-15
  • 2021-10-18
  • 2022-02-11
猜你喜欢
  • 2022-12-23
  • 2021-10-11
  • 2022-12-23
  • 2021-06-24
  • 2022-12-23
  • 2022-12-23
  • 2021-12-04
相关资源
相似解决方案