【发布时间】:2017-09-12 12:52:20
【问题描述】:
我有一个 Scrapy 蜘蛛,我将系统参数传递给使用 scrapy crawl 命令。我正在尝试使用 CrawlerProcess 而不是命令行来运行这个蜘蛛。如何将所有相同的命令行参数传递给这个爬虫进程?
scrapy crawl example -o data.jl -t jsonlines -s JOBDIR=/crawlstate
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
process = CrawlerProcess(get_project_settings())
process.crawl(#How do I Pass arguments like -o data.jl -t jsonlines -s
JOBDIR=/crawlstate here?)
process.start()
【问题讨论】:
标签: python-2.7 scrapy