【发布时间】:2023-03-15 05:41:01
【问题描述】:
我正在使用scrapy 和scrapyd 来抓取一些内容。我有 28 个爬虫在运行,但一次只有 8 个。每个爬虫需要 10 分钟到几个小时才能完成。因此,我正在寻找一种正确订购它们的方法,以最大程度地减少服务器处于活动状态的时间。
我已经收集了每次抓取需要多长时间的信息,所以这只是最小化问题,或者如何制定它。
脚本使用 php 启动,因此解决方案最好在 php 中运行。
【问题讨论】:
标签: php scrapy minimization