【发布时间】:2012-10-24 03:55:53
【问题描述】:
所以我有一个 sub-reddits 列表,我正在使用 urllib 打开它们。当我浏览它们时,最终 urllib 失败了:
urllib2.HTTPError: HTTP Error 429: Unknown
做了一些研究,我发现 reddit 通过 IP 限制了对其服务器的请求数量:
每两秒发出不超过一个请求。有一些请求突发的余地,但要保持理智。一般来说,保持在一分钟内不超过 30 个请求。
所以我想我会使用time.sleep() 将我的请求限制为每 10 秒一页。这最终也会失败。
以上引用来自reddit API 页面。我没有使用 reddit API。在这一点上,我在想两件事。该限制仅适用于 reddit API,或者 urllib 也有限制。
有谁知道这是这两件事中的哪一件?或者我该如何解决这个问题?
【问题讨论】:
-
urllib2没有限制,您可以通过尝试其他网页发现。他们可能阻止了您的 IP 访问 API,请尝试向他们发送电子邮件。 -
@larsmans 请求随机通过。我得到了一些然后它失败了一段时间然后它再次工作。他们也不能阻止我使用他们的 API,因为我没有使用他们的 API。
标签: python urllib2 reddit http-status-code-429