【发布时间】:2019-09-26 18:08:34
【问题描述】:
我正在尝试使用 beautifulsoup 解析网页。我可以看到页面已使用 chromedriver 在 selenium 中正确加载,但最终结果为 null,当我在 beautifulsoup 中看到解析的页面打印时,它没有显示 selenium 在其自动浏览器中显示的整个页面。
我为此目的使用的代码是:
page_soup = soup(driver.page_source, "html.parser")
print (page_soup)
containers = page_soup.findAll("div", class_="row ploc-l-row--gutterV flex-wrap flex-align-start flex-center-vertical")
print (len(containers))
我需要访问每个合作伙伴的信息,但结果为空。我正在处理的页面是
https://locatr.cloudapps.cisco.com/WWChannels/LOCATR/openBasicSearch.do;jsessionid=8CDF9284D014CFF911CB8E6F81812619
【问题讨论】:
-
您想使用
page_soup.findAll查找页面上的哪些元素?我已经在您提供的页面链接上运行了您的选择器,但它没有返回任何结果,因此选择器可能是错误的。 -
如您所知,该页面是具有多个结果的搜索页面。我想访问每个结果。例如,当您搜索中国时,它会在第一页显示 5 个结果,我想访问每个结果。正如我所看到的,每个结果都在一个带有我上面提到的类名的类的 div 中。
-
我已经根据您提供的内容编写了一些修改后的 BeautifulSoup 代码,并更改了选择器。此代码将检索搜索结果页面上列出的每个合作伙伴的
name。 -
加载该链接时未找到任何结果。
标签: python selenium beautifulsoup