【发布时间】:2016-01-22 15:35:40
【问题描述】:
我正在抓取一个包含表格的页面,我可以通过这种方式提取我感兴趣的链接:
response.xpath('//*[@id="mw-content-text"]/table[1]/tr/td[1]/a/@href').extract()
如果我这样写,现在有 3 个或更多表:
response.xpath('//*[@id="mw-content-text"]/table/tr/td[1]/a/@href').extract()
我得到了所有表的数据,但是如果我只想要 n 个表,有一种方法可以在不使用 n 表达式的情况下获取它,某事 像这样:
response.xpath('//*[@id="mw-content-text"]/table[1:n]/tr/td[1]/a/@href').extract()
?
【问题讨论】: