【发布时间】:2012-11-19 02:25:08
【问题描述】:
我正在制作一个网络爬虫,我想完全删除一些 div,因为我对数据的分析不需要它们。 我正在使用 Beautiful Soup 来解析数据,但我无法弄清楚如何完全消除 div
【问题讨论】:
-
With lxml.html: from lxml import html doc = html.fromstring(input) for el in doc.cssselect('div.comment'): el.drop_tree() result = html.tostring(文档)
标签: python html web-scraping beautifulsoup