【发布时间】:2015-03-13 05:12:47
【问题描述】:
我正在尝试检索此网站的广告 URL: http://www.appledaily.com
广告网址是使用 javascript 加载的,因此标准爬虫无法工作。刷新页面时,广告也会发生变化。
我发现了这个问题here,我收集到的是我们需要首先使用 selenium 在浏览器中加载页面,然后使用 Scrapy 检索 url。我有一些使用scrapy的经验,但在使用Selenium方面完全没有。任何人都可以向我展示/指向我如何编写脚本来做到这一点的资源吗?
非常感谢!
编辑:
我尝试了以下方法,但都无法打开广告横幅。任何人都可以帮忙吗?
from selenium import webdriver driver=webdriver.Firefox()
driver=webdriver.Firefox()
driver.get('http://appledaily.com')
adBannerElement = driver.find_element_by_id('adHeaderTop')
adBannerElement.click()
第二次尝试:
adBannerElement =driver.find_element_by_css_selector("div[@id='adHeaderTop']")
adBannerElement.click()
【问题讨论】:
-
查看此链接,应该可以帮助您入门 - stackoverflow.com/questions/17975471/…
-
谢谢,我查看了它,但仍然卡住了。请看我的编辑