【发布时间】:2014-05-04 02:47:10
【问题描述】:
我是 Python 和 Scrapy 的新手。我以前没有使用过回调函数。但是,我现在为下面的代码做。将执行第一个请求,并将其响应发送到定义为第二个参数的回调函数:
def parse_page1(self, response):
item = MyItem()
item['main_url'] = response.url
request = Request("http://www.example.com/some_page.html",
callback=self.parse_page2)
request.meta['item'] = item
return request
def parse_page2(self, response):
item = response.meta['item']
item['other_url'] = response.url
return item
我无法理解以下内容:
-
item是如何填充的? -
request.meta行是否在parse_page2中的response.meta行之前执行? -
parse_page2返回的item去哪了? -
parse_page1中的return request语句需要什么?我认为提取的项目需要从这里返回。
【问题讨论】: