【发布时间】:2016-04-13 22:41:15
【问题描述】:
所以我使用 selenium/phantomjs 中最基本的方式来执行向下滚动操作。 它似乎在代码中都很好,但不起作用。 我尝试打印“document.body.scrollHeight”,每次滚动后它都保持不变。 (例如高度保持在 10532)
我正在浏览某个人的推特页面,例如“twitter.com/XXXXX”
谁能给我提示一下我可以在这里做什么?
我使用的 webdriver 是 phantomjs
代码如下:
def getfullpage(url):
print "getting fullpage..."
driver.get(url)
time.sleep(2)
reloads = 3000
pause = 0
driver.save_screenshot("what'shappening.jpg")
for times in range(reloads):
driver.execute_script("window.scrollTo(0,document.body.scrollHeight);")
time.sleep(pause)
newheight = driver.execute_script("return document.body.scrollHeight")
print newheight
page = driver.page_source.encode("utf-8","ignore")
return page
【问题讨论】:
-
你检查过 phantomjs 是否有滚动条吗?当然,无头浏览器不会滚动......
标签: javascript python selenium web-scraping phantomjs