【发布时间】:2017-06-30 11:30:49
【问题描述】:
我正在尝试使用请求对象抓取一个带有scrapy 的网站。我通过需要身份验证的代理连接到 Internet,并且此身份验证阻止我抓取网站:
DEBUG: Crawled (400) <GET http://auth4/robots.txt> (referer: None)
如何在代理中进行身份验证或跳过它以访问网站?
谢谢!!
【问题讨论】:
标签: python authentication proxy scrapy web-crawler