【发布时间】:2013-10-02 14:04:21
【问题描述】:
我最近从 Beautifulsoup 切换到 lxml,因为 lxml 可以处理损坏的 HTML,这就是我的情况。我想知道完成 Beautifulsoup find() 的等效形式或程序形式是什么。您在 BS 中看到,我可以通过如下搜索找到树节点:
bs = BeautifulSoup(html)
bs.find('span', {'class': 'some-class-name'})
lxml find() 只是在树上搜索当前层级,如果我想在所有的树节点中搜索呢?
谢谢
【问题讨论】:
标签: python beautifulsoup lxml