【发布时间】:2016-09-13 19:06:00
【问题描述】:
我想用 node.js 抓取我的大学网站 (moodle),但我还没有找到能够做到这一点的无头浏览器。我使用 RoboBrowser 在 python 中只用了 10 行代码就完成了:
from robobrowser import RoboBrowser
url = "https://cas.upc.edu/login?service=https%3A%2F%2Fatenea.upc.edu%2Fmoodle%2Flogin%2Findex.php%3FauthCAS%3DCAS"
browser = RoboBrowser()
browser.open(url)
form = browser.get_form()
form['username'] = 'myUserName'
form['password'] = 'myPassword'
browser.submit_form(form)
browser.open("http://atenea.upc.edu/moodle/")
print browser.parsed
问题是该网站需要身份验证。你能帮助我吗?谢谢!
PD:我认为这可能很有用 https://www.npmjs.com/package/form-scraper,但我无法让它发挥作用。
【问题讨论】:
标签: javascript python node.js meteor