xpath学习记录
选取节点,下面列出了最有用的路径表达式:
| 表达式 | 描述 |
|---|---|
| nodename | 选取此节点的所有子节点。 |
| / | 从根节点选取。 |
| // | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 |
| . | 选取当前节点。 |
| … | 选取当前节点的父节点。 |
| @ | 选取属性。 |
xpath常用语法和函数
现在遇到常用的分别是: / , //, @,contains/可以理解为绝对路径//可以理解为相对路径@属性选择contains 函数,包含值
举例:
获取a标签的链接(href属性),使用方法://a/@href
获取某div下的文本内容://div/text()
获取某class属性的div文本内容://div[@class="class属性"]/text()
获取包含class名为box的div://div[contains(@class,'box')] , 这样的话<div class="box clearfix"></div> 和 <div class="div"></div> 都会选到。
使用chrome获取xpath的使用方法
1 . 使用鼠标右键审查元素;
2 . 右键开发者工具的当前元素,例如在a标签上鼠标右键;
3 . 选择copy >>> copy xpath
4 . 粘贴结果://*[@id="con-ar"]/div[2]/div/div/table/tbody[1]/tr[10]/td[1]/span/a
5 . 如果想获取多个,可以根据xpath自行更改,例如想获取10个热搜结果,需要把 tr[10] 更改为 tr ,即://*[@id="con-ar"]/div[2]/div/div/table/tbody[1]/tr/td[1]/span/a,通过chrome的xpath扩展插件验证。