【发布时间】:2018-07-20 22:33:34
【问题描述】:
我想从“news”类中抓取所有href内容(代码中提到了Url),我试过这段代码,但它不起作用...
代码:
from bs4 import BeautifulSoup
from selenium import webdriver
Base_url = "http://www.thehindubusinessline.com/stocks/abb-india-ltd/overview/"
driver = webdriver.Chrome()
driver.set_window_position(-10000,-10000)
driver.get(Base_url)
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')
for div in soup.find_all('div', class_='news'):
a = div.findAll('a')
print(a['href'])
谢谢
【问题讨论】:
-
我认为您的问题是该页面没有任何带有新闻类的
divs。它有articles 和新闻类。 -
@jayant 你知道有什么方法可以刮掉所有这些href吗?我想要所有这些 href 内容(最新消息)
标签: python selenium web-scraping beautifulsoup