【发布时间】:2016-05-13 19:52:47
【问题描述】:
如何使用scrapy 在代理上进行代理(2 层)?我假设这里是 http/https 代理。
比如我的本地机器-->proxy1-->proxy2-->我要爬取的站点。 如何在scrapy中做到这一点?
我为什么要这样做?
目标是隐藏我的 IP 地址。你可以认为proxy1很靠谱,但是被我要爬的网站屏蔽了。而且proxy2不可靠,但可以访问我要抓取的站点。
我可以做我的本地机器 -->proxy2 --> 我想爬的网站。但是因为proxy2不可靠,所以我可以把我的ip地址暴露给我想爬的站点。所以我想在proxy2之前再加一层来保护它。
【问题讨论】:
-
我觉得这更像是
proxy1上的配置,不是scrapy应该知道的。
标签: python proxy scrapy http-proxy