【发布时间】:2011-04-19 16:24:10
【问题描述】:
我正在研究网络爬虫 [使用 python]。
例如,我在 server-1 后面,我使用代理设置连接到外部世界。所以在 Python 中,使用代理处理程序我可以获取 url。 现在的事情是,我正在构建一个爬虫,所以我不能只使用一个 IP [否则我将被阻止]。为了解决这个问题,我有一堆代理,我想洗牌。
我的问题是:这是两级代理,一个连接到主服务器-1,我使用代理,然后通过代理进行洗牌,我想使用代理。我怎样才能做到这一点?
【问题讨论】:
标签: python web-crawler