【发布时间】:2020-09-11 08:44:37
【问题描述】:
这对我有用:
library(XML)
tables <- readHTMLTable("http://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE)
bottom_table <- tables[[2]]
# process bottom_table's data, deploy to Shiny app
但是当我使用https 而不是http 时:
tables <- readHTMLTable("https://cdec.water.ca.gov/reportapp/javareports?name=FNF", as.data.frame = TRUE)
# Warning: XML content does not seem to be XML`
所以,我希望了解如何识别表格的内容类型以及用于抓取和保留表格格式的 R 库/函数。感谢您的任何提示。
【问题讨论】:
-
我注意到 readHTMLTable() 不支持
https但是这个RCurl解决方法成功了:stackoverflow.com/questions/25947566/… -
我在“http:// https:// [r] xml”上进行了搜索,第二次点击看起来可能解决了您的问题,我认为可以表述为“为什么 readHTMLTable 什么都看不到https:// 页面?”