【发布时间】:2016-10-04 12:21:00
【问题描述】:
我想使用 R 中的 URL 保存 HTML 文件。
我试图在网站的 URL 上分别使用 httr 和 rvest 包的 GET 和 read_html 函数后保存响应对象,我想保存的 HTML。但这并不能保存网站的实际内容。
url = "https://facebook.com"
get_object = httr::GET(url); save(get_object, "file.html")
html_object = rvest::read_html(url); save(html_object, "file.html")
这些都不能将实际网站的正确输出(即 .html 文件中的网页 HTML 内容)保存在 HTML 文件中。
【问题讨论】:
-
什么是“正确”的输出,你得到了什么?
-
我正在寻找的正确输出是
file.html文件中网页的 HTML 内容我在file.html文件中发现了一些垃圾。