【发布时间】:2014-02-02 13:25:13
【问题描述】:
我正在尝试为我的大学网站制作网络爬虫,但我无法通过登录页面。
import requests
URL = "https://login.ull.es/cas-1/login?service=https%3A%2F%2Fcampusvirtual.ull.es%2Flogin%2Findex.php%3FauthCAS%3DCAS"
USER = "myuser"
PASS = "mypassword"
payload = {
"username": USER,
"password": PASS,
"warn": "false",
"lt": "LT-2455188-fQ7b5JcHghCg1cLYvIMzpjpSEd0rlu",
"execution": "e1s1",
"_eventId": "submit",
"submit": "submit"
}
with requests.Session() as s:
r = s.post(URL, data=payload)
#r = s.get(r"http://campusvirtual.ull.es/my/index.php")
with open("test.html","w") as f:
f.write(r.text)
该代码显然不起作用,我不知道哪里出错了,我尝试只将用户名和密码放在有效负载中(其他值在标记为隐藏的网络源代码中)但是这也失败了。
谁能指出我正确的方向?谢谢。 (对不起我的英语)
【问题讨论】:
-
python有没有报错?
r.text的内容是什么? -
请说明您的期望和实际发生的情况。如果您说“显然无法正常工作”,则很难找出问题所在。您还应该告诉我们您收到了哪些错误消息。
-
我建议您使用wiki.jasig.org/display/CASC/Pycas 让生活更轻松。
-
您确定您的网址吗?我认为正确的是login.ull.es/cas-1/login
-
@Llopis 额外的后缀只是登录后重定向到的页面。
标签: python forms python-3.x python-requests