【发布时间】:2020-09-16 20:24:37
【问题描述】:
def parse_pagelist(self,response):
for page in pageinfo:
page_url=page['url']
yield response.follow(page_url,self.parse_page)
next_page=response.xpath('//ol[@class="page-main"]/li[last()]/a/@href').get()
if next_page:
return [response.follow(next_page,callback=self.parse_pagelist)]
在关于 spider.parse 的 scrapy 文档中它说:
此方法以及任何其他 Request 回调必须返回 >Request 和/或 item 对象的可迭代对象。
这里我返回一个 list 对象包含scrapy.Request,但它永远无法下载,这是为什么呢?
【问题讨论】:
标签: web-scraping scrapy