【发布时间】:2020-09-18 13:59:52
【问题描述】:
我在一个文件夹中有一组本地 html 文件。使用下面的代码,我可以导入数据。作为下一步,我想合并几个文件(都具有相同的格式),将数据和内容提取为表格格式以供进一步分析
source <- FactivaSource("page1.html")
corpus <- Corpus(source, readerControl = list(language = NA))
inspect(corpus)
meta(corpus[[1]])
【问题讨论】:
-
看看
rvest包,处理html信息和提取数据真的很方便