【发布时间】:2020-04-01 15:54:57
【问题描述】:
所以,我正在抓取一个网站,但时不时地我会被临时禁止几分钟。我在我的代码中使用标题进行抓取,但我想知道是否还有更多的东西可以让我们看起来像一个真实的人,而不仅仅是一个机器人。
我研究了一下,发现我们可以让我们的抓取速度稍微慢一点,也可以绕过检测。
我想听听您的想法和建议。
ua=UserAgent()
hdr = {'User-Agent': ua.random,
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Accept-Encoding': 'none',
'Accept-Language': 'en-US,en;q=0.8',
'Connection': 'keep-alive'}
(不得不放这个代码,因为它不允许我发布它!)
【问题讨论】:
-
很可能他们已经保存了您的 IP。
标签: web-scraping beautifulsoup python-requests