【发布时间】:2016-04-24 16:17:38
【问题描述】:
我用 Python 2.7 写了一个网络爬虫,但是在浏览器中可以查看特定站点却无法下载。
我的代码如下:
# -*- coding: utf-8 -*-
import requests
# OK
url = 'http://blog.ithome.com.tw/'
url = 'http://7club.ithome.com.tw/'
url = 'https://member.ithome.com.tw/'
url = 'http://ithome.com.tw/'
url = 'http://weekly.ithome.com.tw'
# NOT OK
url = 'http://download.ithome.com.tw'
url = 'http://apphome.ithome.com.tw/'
url = 'http://ithelp.ithome.com.tw/'
try:
response = requests.get(url)
print 'OK!'
print 'response.status_code: %s' %(response.status_code)
except Exception, e:
print 'NOT OK!'
print 'Error: %s' %(e)
print 'DONE!'
print 'response.status_code: %s' %(response.status_code)
每次我尝试都会收到此错误:
C:\Python27\python.exe "E:/python crawler/test_ConnectionFailed.py"
NOT OK!
Error: ('Connection aborted.', BadStatusLine("''",))
DONE!
Traceback (most recent call last):
File "E:/python crawler/test_ConnectionFailed.py", line 29, in <module>
print 'response.status_code: %s' %(response.status_code)
NameError: name 'response' is not defined
Process finished with exit code 1
为什么会发生这种情况,我该如何解决?
已解决!我只是用别的代理软件,然后OK!
【问题讨论】:
-
@MarcoFerrari 编辑得很好,但是代码中的这些 cmets 是从哪里来的?
-
@M4rtini,感谢您的编辑,但问题的答案并没有解决我的问题。
标签: python python-2.7 web-crawler python-requests