【发布时间】:2012-10-23 15:49:33
【问题描述】:
我正在尝试从 https 页面下载文件,该页面需要按下“我同意”按钮,然后存储 cookie。如果这个答案在某处很明显,我深表歉意..
当我直接在 Chrome 中打开网页并点击“我同意”时 - 文件开始自动下载。
我尝试复制this example,但我不认为hangseng 网站实际上存储cookie/身份验证,所以我不知道该示例是否应该是我所需要的。
除此之外,我认为 SSL 使身份验证复杂化,因为我认为 getURL() 调用将需要像 cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl") 这样的证书规范)
我是 RCurl 的初学者,不知道这个网站是不是很难,或者我只是错过了一些明显的东西。
谢谢!
【问题讨论】:
-
这个来自 Rhelp 的 url 可能有用:我保存了它但还不需要它:(LINK)
标签: r web-scraping rcurl