【发布时间】:2014-04-11 09:32:43
【问题描述】:
在解析 HTML 内容时,有什么方法可以阻止 etree 解析 HTML 实体?
html = etree.HTML('<html><body>&</body></html>')
html.find('.//body').text
这给了我 '&' 但我想得到 '&'自己。
【问题讨论】:
-
一种选择/解决方法是使用
cgi.escape处理正文文本,请参阅stackoverflow.com/questions/1061697/…。
标签: python lxml elementtree