【发布时间】:2016-09-27 14:12:16
【问题描述】:
我正在尝试创建一个 XPath,它将指向按钮的 href 属性(处理分页)。
我的 XPath 如下:
//a[contains(@class, 'h-data-pagination__next')]//@href
返回以下网址:
http://www.bestcolleges.comhttp//www.bestcolleges.com/database/?pg=2
问题在于 XPath 似乎将新 URL 属性添加到旧属性而不是替换它。
【问题讨论】:
标签: html xml xpath web-scraping extraction