【发布时间】:2019-03-01 06:03:36
【问题描述】:
试图在此页面上抓取每个项目推土机的所有信息。 我刚刚开始,对抓取只有相当的想法,但不知道该怎么做。
driver=webdriver.Firefox()
driver.get('https://www.rbauction.com/dozers?keywords=&category=21261693092')
soup=BeautifulSoup(driver.page_source,'html.parser')
#trying all d/f ways buh getting oly nonetype or no element
get= soup.findAll('div' , attrs={'class' : 'sc-gisBJw eHFfwj'})
get2= soup.findAll('div' , attrs={'id' : 'searchResultsList'})
get3= soup.find('div.searchResultsList').find_all('a')
我必须进入每个类/id 并循环 a['href'] 并获取每个推土机的信息。 请帮忙。
【问题讨论】:
-
您面临的问题是什么
-
@Preethi 你能用你正在寻找的此页面上每个项目推土机的确切信息更新问题吗?请edit the question 将其限制为具有足够详细信息的特定问题,以确定适当的答案。避免一次问多个不同的问题。请参阅How to Ask 页面以获得澄清此问题的帮助。
标签: python selenium beautifulsoup