【发布时间】:2017-09-19 09:44:14
【问题描述】:
我正在尝试使用 R 下载并保存一个 pdf 文件。
此文件在 Chrome 和 Edge 中完美显示:http://www.cpppc.org:8082/efmisweb/ppp/projManage/perview.do?&ftpFileName=20170317105445289.pdf&content=efmisweb&xsg=:8083/
以下 R 代码可以正常工作:
download.file('http://www.cpppc.org:8082/efmisweb/ppp/projManage/perview.do?&ftpFileName=20170317105445289.pdf&content=efmisweb&xsg=:8083/', '20170317105445289.pdf', mode="wb")
R 显示
trying URL 'http://www.cpppc.org:8082/efmisweb/ppp/projManage/perview.do?&ftpFileName=20170317105445289.pdf&content=efmisweb&xsg=:8083/'
Content type 'text/html; charset=UTF-8' length 2707 bytes
downloaded 2707 bytes
唯一的提示是文件大小比我预期的要小很多。
确实,当我使用 Adobe Acrobat 打开它时,它给了我一个错误,说它不是受支持的文件类型,或者文件已损坏。是什么导致错误?
我注意到answers to other questions 说你应该包括mode=wb,所以我已经这样做了。
【问题讨论】:
-
如果您查看该网页的源代码,您会发现那里没有任何数据。 Chrome 会继续执行哪些 javascript 来为您提供内容。
download.file不执行 javascript。