【发布时间】:2014-07-29 23:13:12
【问题描述】:
Scrapy 可以请求带有GET 参数的 URL 以交互探索响应:
scrapy shell "https://duckduckgo.com/?q=foo"
但是对于某些网站,我的请求会被 301 重定向并且 URL 参数被剥离:
DEBUG: Redirecting (301) to <GET http://foo.com/mypage/>
from <GET http://foo.com/mypage/?bar=baz>
DEBUG: Crawled (200) <GET http://foo.com/mypage/> (referer: None)
当我在浏览器中正常访问http://foo.com/mypage/?bar=baz 时,我不会被重定向,GET 参数仍然存在。
谁能建议我如何避免被重定向?
【问题讨论】:
-
发布你得到的整个代码和错误。
-
嘿,我已经发布了整个代码和输出消息。
-
@user2019135 ,尝试使用浏览器的用户代理字符串,例如
USER_AGENTsetting -
@paultrmbrth 我遇到了这个确切的问题,您的解决方案解决了这个问题。请张贴作为答案,我会投票。