【发布时间】:2014-07-05 17:58:28
【问题描述】:
我应该将一些从 json 文件中获取的参数传递给蜘蛛。我已经读过可以通过scrapyd使用 schedule.json 但我不明白如何传递 json 文件。你们有人有经验吗?
【问题讨论】:
标签: json scrapy parameter-passing scrapyd
我应该将一些从 json 文件中获取的参数传递给蜘蛛。我已经读过可以通过scrapyd使用 schedule.json 但我不明白如何传递 json 文件。你们有人有经验吗?
【问题讨论】:
标签: json scrapy parameter-passing scrapyd
您不使用 JSON 文件传递参数。 Scrapyd 有一个 JSON API,您可以在其中传递参数。 (例如$ curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider -d myargument="value")
你可以处理通过kwargs传递的参数:
class MySpider(Spider):
name = 'somespider'
def __init__(self, *args, **kwargs):
super(MySpider, self).__init__(*args, **kwargs)
self.myargument = kwargs.get('myargument', '')
请参阅http://scrapyd.readthedocs.org/en/latest/api.html 了解更多信息。
【讨论】:
-d /path/to/file)并让您的蜘蛛在其代码中的某个位置处理它。
我有同样的问题(我想传递一个json文件给蜘蛛来实现一个简单的分布式爬虫系统。
我只是通过将json文件转换为字符串作为scrapyd中的参数来解决它。
【讨论】: