【发布时间】:2020-05-26 22:27:36
【问题描述】:
我正在使用模块谷歌搜索网页抓取,但我收到此错误 429。我尝试再次卸载并安装模块,但没有帮助。所以我的下一个想法是删除cookies,但我不知道怎么做。你能帮帮我吗?
query = 'site:https://stackoverflow.com urllib.error.HTTPError: HTTP Error 429: Too Many Requests'
search_query = search(query=query, stop=10)
for url in search_query:
print(url)
【问题讨论】:
-
由于发送的请求过多,Stackoverflow 对您进行了速率限制。这是为了防止 DoS 攻击。解决这个问题的唯一方法是使用代理,但更好的办法是编写一个根本不会很快发送请求的程序
-
我再次尝试卸载并安装模块,但没有帮助。 为什么会有帮助?引用Mozilla developer docs:HTTP 429 Too Many Requests 响应状态代码表明用户在给定时间内发送了太多请求(“速率限制”)。此响应中可能包含 Retry-After 标头,指示在发出新请求之前要等待多长时间。
-
所以我的下一个想法是删除 cookie,但我不知道怎么做。我确信有很多现有资源可以做到这一点。
标签: python google-search