【发布时间】:2021-03-20 07:10:13
【问题描述】:
我正在寻找这种表格的内容:
http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/
我可以通过以下方式获取行:
rows = response.xpath('//*[@id="middle_tab_content"]/table/tr[]').extract()
问题是表格中有几个页面保持相同的链接
http://www.trulia.com/school-district/CA-San_Francisco_County/San_Francisco_Unified/
并且行也保持相同的Xpath,表中没有变化
编辑。
@Salman:我看到了 Network 选项卡,但找不到 XHR 子选项卡
【问题讨论】:
标签: python web-scraping scrapy