【发布时间】:2020-04-29 17:47:28
【问题描述】:
我尝试在设置中使用CLOSESPIDER_TIMEOUT 扩展来杀死运行超过 3 小时的蜘蛛。
CLOSESPIDER_TIMEOUT = 3 * 60 * 60
虽然蜘蛛收到关闭超时请求,但它并没有真正停止蜘蛛,它继续运行。
对这种情况下出了什么问题有什么想法吗?
【问题讨论】:
标签: scrapy
我尝试在设置中使用CLOSESPIDER_TIMEOUT 扩展来杀死运行超过 3 小时的蜘蛛。
CLOSESPIDER_TIMEOUT = 3 * 60 * 60
虽然蜘蛛收到关闭超时请求,但它并没有真正停止蜘蛛,它继续运行。
对这种情况下出了什么问题有什么想法吗?
【问题讨论】:
标签: scrapy
如果您的蜘蛛收到关闭超时请求,则扩展程序似乎正在工作。看起来并没有什么问题,但您可能需要在蜘蛛完全关闭之前稍等片刻,因为它会先完成已经安排好的请求,然后再完全关闭。
【讨论】:
CLOSESPIDER_TIMEOUT 之后-scrapy 将停止安排新的请求,并在CLOSESPIDER_TIMEOUT 之后继续执行已经安排好的请求。你也可以检查这个solution - 打电话给os._exit(0)