【发布时间】:2014-03-24 04:41:31
【问题描述】:
我正在尝试使用 python 从 URL 中读取一些内容,但每次尝试时都会收到 404。
这是我的测试代码,以及有问题的 URL:
url = 'http://supercoach.heraldsun.com.au'
headers = {"User-agent": "Mozilla/5.0"}
req = urllib2.Request(url, None, headers)
try:
handle = urllib2.urlopen(req)
except IOError, e:
print e.code
该站点在浏览器中运行良好,我之前对此脚本没有任何问题,但最近对该站点的更新导致它失败。
我已尝试添加用户代理标头,因为类似问题有此建议。
任何想法为什么这不起作用?
谢谢 JP
【问题讨论】:
-
@Ruben,所以你得到 303?这是通过运行上面的代码确定的吗?我肯定会得到 404,但也许这是系统特定的事情。