【发布时间】:2017-05-25 18:13:32
【问题描述】:
我注意到有时我在抓取时被阻止,因为在太多页面上使用了会话 cookie。 有没有办法在爬取过程中简单地清除所有cookies,回到爬虫的初始状态?
【问题讨论】:
-
谢谢!我看到了这个线程,但它解释了如何设置新的 cookie,而不是如何在已经产生的请求上清除它们。
-
你看过第二个答案了吗? stackoverflow.com/a/21930089/1534704
-
是的。设置 COOKIES_ENABLED = False 将完全阻止 scrapy 存储 cookie。就我而言,我需要抓取 cookie,但我想在我的 IP 被列入黑名单时更新它们(与 IP 更改同时)。
-
不是该主题的专家,但设置新的 cookie(名称相同但值不同)与 更新它们不同?无论如何,也许另一个问题的答案不适合你的情况,但问题本身对我来说显然是重复的......也许你可以详细说明你的问题以避免这种重复。 Idk,只是想帮忙... :)