【发布时间】:2016-06-09 22:03:27
【问题描述】:
我开始学习使用 Python 和 Selenium 抓取网站。我选择 selenium 是因为我需要浏览网站并且还必须登录。
我编写了一个脚本,它可以打开一个 firefox 窗口并打开网站 www.flashscore.com。使用此脚本,我还可以登录并导航到他们拥有的不同运动部分(主菜单)。
代码:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
# open website
driver = webdriver.Firefox()
driver.get("http://www.flashscore.com")
# login
driver.find_element_by_id('signIn').click()
username = driver.find_element_by_id("email")
password = driver.find_element_by_id("passwd")
username.send_keys("*****")
password.send_keys("*****")
driver.find_element_by_name("login").click()
# go to the tennis section
link = driver.find_element_by_link_text('Tennis')
link.click()
#go to the live games tab in the tennis section
# ?????????????????????????????'
然后它变得更加困难。例如,我还想导航到体育领域的“现场比赛”和“完成”选项卡。这部分行不通。我尝试了很多东西,但我无法进入其中一个选项卡。在分析网站时,我发现他们使用了一些 iframe。我还找到了一些代码来切换到 iframe 窗口。但问题是,我找不到要单击的选项卡所在的 iframe 的名称。也许 iframe 不是问题,我看错了方向。 (也许问题是由某些 javascript 引起的?)
有人可以帮我解决这个问题吗?
【问题讨论】:
标签: python selenium web-scraping