【发布时间】:2018-03-04 21:48:43
【问题描述】:
我正在尝试读取文件夹中的所有文本文件以及我在做什么:
- 从特定的 html 标签“TEXT”读取每个文本文件
- 存储列名为“MyText”的数据框
- 从下一个文本文件读取后追加下一行(如上)
我的代码是:
library(dplyr); library(readr); library(rvest); library(data.table);
# List all the text files in the folder
files = list.files(pattern="*.txt")
# read from file and append to rows
tbl = lapply(files, read_html %>% html_nodes("text") %>% html_text() ) %>% bind_rows()
这给我一个错误:
Error in UseMethod("xml_find_all") :
no applicable method for 'xml_find_all' applied to an object of class "function"
有人可以帮忙纠正我哪里错了吗?
【问题讨论】:
-
试试
tbl = lapply(files, function(x) read_html(x) %>% html_nodes("text") %>% html_text() ) %>% bind_rows() -
@AndrewGustar 感谢您帮助我:但我收到此错误
Error in bind_rows_(x, .id) : Argument 1 must have names
标签: r dplyr data.table rvest readr