【发布时间】:2014-12-01 21:01:04
【问题描述】:
我正在使用rvest 解析网站。我正在用这些小的非破坏空间撞墙。如何删除已解析的 html 文档中  元素创建的空白?
library("rvest")
library("stringr")
minimal <- html("<!doctype html><title>blah</title> <p> foo")
bodytext <- minimal %>%
html_node("body") %>%
html_text
现在我已经提取了正文:
bodytext
[1] " foo"
但是,我无法删除那个讨厌的空格!
str_trim(bodytext)
gsub(pattern = " ", "", bodytext)
【问题讨论】: