【发布时间】:2015-06-06 17:58:52
【问题描述】:
The official tutorial指定如何在python脚本中调用scrapy的方式
通过更改以下设置属性:
settings.overrides['FEED_URI'] = output_path
settings.overrides['FEED_FORMAT'] = 'json'
我能够将抓取的数据存储在 json 文件中。
但是,我正在尝试处理并返回在我定义的函数中立即抓取的数据。因此,其他函数可以调用这个包装函数来报废一些网站。
我认为FEED_URI 肯定有一些设置可以玩,但我不确定。任何建议将不胜感激!
【问题讨论】:
-
创建管道?见this answer(非官方教程)。