【发布时间】:2017-02-23 03:49:23
【问题描述】:
我正在使用Selenium 库和PhantomJs 浏览器编写Python 爬虫。我在一个页面中触发了点击事件打开一个新页面,然后我使用了browser.page_source的方法,但是我得到的是原始页面源而不是新打开的页面源。不知如何获取新的开放页面源码?
这是我的代码:
import requests
from selenium import webdriver
url = 'https://sf.taobao.com/list/50025969__2__%D5%E3%BD%AD.htm?auction_start_seg=-1&page=150'
browser = webdriver.PhantomJS(executable_path='C:\\ProgramData\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe')
browser.get(url)
browser.find_element_by_xpath("//*[@class='pai-item pai-status-done']").click()
html = browser.page_source
print(html)
browser.quit()
【问题讨论】:
标签: python selenium phantomjs web-crawler