【发布时间】:2021-02-25 15:32:01
【问题描述】:
我尝试抓取网页,但以下页面出现问题: “https://www.federalreserve.gov/boarddocs/speeches/1998/19980828.htm”
每次我尝试将其加载到 R 中时,都会收到以下错误消息。
library(rvest)
page <- read_html( "https://www.federalreserve.gov/boarddocs/speeches/1998/19980828.htm")
> page
{html_document}
<html>
Error in nchar(desc) : invalid multibyte string, element 2
我已经搜索了很多解决方案并尝试了以下方法:
-) 将编码从“UTF-8”更改为“ISO-8859-1”或“latin1”->我现在可以将页面加载到 R 中,但它不包含任何文本,只有空段落
-) 我设置了 "Sys.setlocale("LC_ALL", "English")" 或 "Sys.setlocale("LC_CTYPE", "en_US.UTF-8")",但它并没有改变任何东西。
我现在有点无助。也许你可以帮助我或给我新的想法。
最好的问候!
【问题讨论】:
标签: r web-scraping rvest