【发布时间】:2014-09-15 02:19:30
【问题描述】:
http://www.leboncoin.fr/montres_bijoux/671762293.htm
我正在尝试打开这个网址
import requests
s = requests.Session()
s.headers['User-Agent'] = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/34.0.1847.116 Chrome/34.0.1847.116 Safari/537.36'
s.headers['Host'] = 'www.leboncoin.fr'
url = 'http://www.leboncoin.fr/montres_bijoux/671762293.htm'
r = s.get(url)
print r.text
当我运行这个脚本时,它会在我的终端中显示这个错误,
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head>
<title>404 Not Found</title>
</head><body>
<h1>Not Found</h1>
<p>The requested URL /montres_bijoux/671762293.htm was not found on this server.</p>
</body></html>
虽然我可以在浏览器中打开相同的 url 并查看内容。
可能是什么问题??
【问题讨论】:
-
你能说明你在哪里设置
url的值吗?您要确保它是完整的 URL(例如 domain.com/asdasd),而不仅仅是路径部分。 -
@okoboko :实际上这段代码在函数中,它接受一个参数,即 url。
-
实际上我在 ipython shell 中做了同样的事情,它也对我有用,但是当我在文件中执行相同的代码时它显示上述错误?
-
“在文件中执行相同的代码”是什么意思?您如何以及在哪里运行它?
-
我创建了一个新文件
test.py并在其中放入相同的代码,然后以python test.py执行该文件
标签: python session python-2.7 python-requests