【发布时间】:2015-02-27 02:39:58
【问题描述】:
好吧,这开始是一个问题,但到了一半我想通了。我在 stackoverflow 或 Google 上找不到这样的问题,所以无论如何我都会发布它以帮助任何偶然发现它的人。
我想使用 BeautifulSoup 中的 SoupStrainer 来解析两个标签,而不是 html 文档中的一个。
我知道我可以做到:
soup = BeautifulSoup(content.text, 'lxml', parse_only=SoupStrainer('p'))
这将获得<p> 标签。我还想获得<h3> 标签。所以我尝试了这个:
soup = BeautifulSoup(content.text, 'lxml', parse_only=SoupStrainer('h3', 'p'))
但这行不通,因为 SoupStrainer 只接受一个参数。
答案如下。
【问题讨论】:
-
如果您要自行回答,请将回答部分放在单独的回答帖中。
标签: python python-3.x beautifulsoup