【发布时间】:2016-07-11 20:04:10
【问题描述】:
我知道内容类型可以从
response = urllib2.urlopen(url)
content-type = response.info().getheader('Content-type')
现在,我需要执行 js 代码,所以我选择 selenium 和 Phantomjs 来获取网页。
driver = webdriver.PhantomJS()
driver.get(url)
source = driver.page_source
如何在不下载网页两次的情况下从源获取内容类型?我知道我可以将 response.read() 保存为 html 文件,然后驱动程序渲染本地 html 文件而无需再次下载。但是,它太慢了。有什么建议?
【问题讨论】:
标签: python selenium phantomjs content-type