【发布时间】:2015-08-26 04:01:02
【问题描述】:
我正在使用 Python 进行网络抓取(使用 Scrapy 框架)。抓取成功,直到它进入该过程大约一个小时,然后每个请求都返回一个 HTTP400 错误代码。
这可能只是基于 IP 的速率限制器或抓取检测工具吗?关于如何进一步调查根本原因的任何建议?
【问题讨论】:
-
400 错误代码是否附带错误消息?
-
是3600秒吗?
标签: python http web-scraping scrapy