【发布时间】:2017-04-02 14:09:02
【问题描述】:
我正在尝试使用 python 开发一个抓取工具,它将在 Chrome 的多个选项卡中打开网页内的链接。
我整理出来的代码是
import urllib2
from datetime import timedelta, date
import selenium.webdriver as webdriver
import selenium.webdriver.support.ui as ui
import time
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome()
i = driver.get("https://investmentinsightindia.wordpress.com/")
driver.find_element_by_partial_link_text(',').click()
driver.get("chrome://newtab/")
我发现该网站上的大多数个人帖子都有一个“,”(在日期中),所以我尝试点击文本中带有 , 的链接。
我确实意识到要让它在多个站点上工作,我最终需要对链接使用更通用的东西,比如来自 Xpath 的 href 引用,我不知道该怎么做。
我该如何配置它 - 1.打开主页(url) 2. 在新选项卡中打开第一个可用链接 3. 保持标签打开 4. 在新标签页中打开第二个可用链接.....等等
【问题讨论】:
-
你能清除一件事吗。要不要点击
Posted on May 17, 2013这种链接?因为逗号,是日期 -
我想点击页面中的每个新帖子。单击日期戳只是我认为会涵盖的一种方法。理想情况下,我想点击网页中的所有帖子
-
你能看到我更新的答案并在 python 中尝试。如果有任何问题,请告诉我。希望对你有帮助
标签: python google-chrome selenium-chromedriver