【发布时间】:2016-01-18 06:13:44
【问题描述】:
我正在构建一个程序来查看谷歌新闻并获取前十个故事的链接,但我遇到了问题。我可以告诉它找到一个特定的链接,因为它们每天都在变化。 selenium 可以找到这些链接所在的位置吗?如果不是我该怎么办?
【问题讨论】:
-
使用 XPath 定义静态位置。
标签: python-3.x selenium
我正在构建一个程序来查看谷歌新闻并获取前十个故事的链接,但我遇到了问题。我可以告诉它找到一个特定的链接,因为它们每天都在变化。 selenium 可以找到这些链接所在的位置吗?如果不是我该怎么办?
【问题讨论】:
标签: python-3.x selenium
尝试查找包含唯一标识 URL 的元素。我看到了 HTML 并注意到链接都在 <h2> 标签内,类为 'esc-lead-article-title'。因此,只需使用 xpath,我就可以获取 URL。
links = driver.get_elements_by_xpath("//h2[@class='esc-lead-article-title']/a")
for link in links:
print(link.get_attribute("url"))
【讨论】:
您可以使用“href”标签名获取所有 url。
尝试使用下面的 selenium Java 示例代码:
List<WebElement> links = mDriver.findElements(By.tagName("a"));
for (WebElement link : links) {
System.out.println("LInk= " + link.getAttribute("href"));
}
【讨论】: