【发布时间】:2021-08-18 09:15:22
【问题描述】:
我正在尝试像这样解析 HTML:
<div id="layers" class="r-1d2f490 r-u8s1d r-zchlnj r-ipm5af r-184en5c" style=""><div class="css-1dbjc4n r-aqfbo4 r-1p0dtai r-1d2f490 r-12vffkv r-1xcajam r-zchlnj">
在我的例子中,类名随着每个请求不断变化,我该如何解析这个元素?
我试过了:
from bs4 import BeautifulSoup
container = soup.find_all('div', attrs={'class':'r-1d2f490 r-u8s1d r-zchlnj r-ipm5af r-184en5c"'})
print(container)
它有时会产生一个结果,但有时它会返回一个空列表。如何使用带有正则表达式的 CSS 选择器来抓取类?
【问题讨论】:
标签: python regex web-scraping beautifulsoup