【发布时间】:2013-10-27 02:42:21
【问题描述】:
我正在使用 Python 和 Scrapy 框架开发一个网络爬虫项目。它从电子商务购物网站抓取大约 10k 网页。整个项目运行良好,但在将代码从测试服务器移动到生产服务器之前,我想选择一个更好的代理 ip 提供商服务,这样我就不必担心我的 IP Blocking 或拒绝访问网站我的蜘蛛。
到目前为止,我在 Scrapy 中使用中间件从各种网站 like this 提供的免费代理 ip 列表中手动轮换 ip
现在我对我应该选择的选项感到困惑
使用TOR
使用 VPN 服务,例如 http://www.hotspotshield.com/
任何优于以上三个的选项
【问题讨论】: