【发布时间】:2017-07-22 14:21:10
【问题描述】:
我想从变量(实际上是 url)中提取一些确切的单词并创建一个仅包含提取的单词的新变量。检查模式我发现我想要字符 \\"> 和 ",如下所示:
> dados$source[1:20]
[1] "<a href=\\\"http://twitter.com/download/iphone\\\" rel=\\\"nofollow\\\">Twitter for iPhone</a>"
[2] "<a href=\\\"http://twitter.com/download/android\\\" rel=\\\"nofollow\\\">Twitter for Android</a>"
[3] "<a href=\\\"http://twitter.com\\\" rel=\\\"nofollow\\\">Twitter Web Client</a>"
我该怎么做?
【问题讨论】:
-
如果
links是上面的数据,则类似于library(purrr); library(rvest); links %>% map(read_html) %>% map_chr(html_text)取决于您要获取的内容,这不清楚。 -
dput(dados$source[1:20]) -
@alistaire 抱歉,我要抢设备,即 iPhone、Android、Web 客户端等...
标签: r html-parsing extract