【发布时间】:2016-10-16 02:38:49
【问题描述】:
我目前正在使用网络抓取工具(Octoparse)从一些网站中提取信息。以前,我可以使用代理来提取信息。我无法使用自己的 IP 地址,因为在提取了一些项目后我会被屏蔽。最近,该网站似乎已阻止代理访问该网站(见下面的截图)。我当然可以找到其他网站,但它们碰巧不如这个。我可以知道是否有办法解决这个问题?
PS:我是一名学生,只是想提取信息制作学习用的闪存卡,没有任何恶意。
【问题讨论】:
-
这是一个非常难的问题。根据保护的类型,您可能不走运。你需要做的事情太多了。
标签: proxy web-scraping server web-crawler bots