【发布时间】:2021-05-06 04:10:40
【问题描述】:
我正在尝试从网站获取漂亮的拉汤信息,并将其打印在控制台中。当它这样做时,它会打印[],我不知道如何修复它。
soup = BeautifulSoup(page_source, "html.parser")
mlsspan = soup.find_all("td.d1m8")
print(mlsspan)
html 被拉取
<td class="d1m8">
<span class="d1m1">
<a href="javascript:__doPostBack('m_DisplayCore','Redisplay|188,,0')">A11033427</a>
</span>
</td>
我不能提供该网站,因为它的密码受保护。
我正在尝试从<a> 标记中获取A11033427。
我也试过
mlsspan = soup.find_all("td.d1m1")
【问题讨论】:
-
试试这个,
soup.find_all('td', attrs={"class":"d1m8"}),这就是你如何在 BeautifulSoup 中提取某个类的项目。 -
另外。页面可能是动态加载的。
标签: python selenium beautifulsoup