【发布时间】:2018-02-15 15:25:36
【问题描述】:
我正在使用这样的脚本收集一些数据:
library(tidyverse)
library(rvest)
library(magrittr)
library(stringr)
foo_matrix <- read_html("#address")
test <- foo_matrix %>%
html_nodes(#Retrieval Information) %>%
html_text() %>%
str_trim
它返回的输出如下所示:
[1] "Red Team" "Mike Johnson" "QB" "6-1" "191" [6] "99" "21" "2" "5" "Joe Smith" [11] "OT" "6-3" "290" "98" "55" [16] "3" "1"
我想要做的是提取字符串中的第一个值(“红队”),然后取出剩余的数据来创建一个八列矩阵:
Mike Johnson QB 6-1 191 99 21 2 5
Joe Smith OT 6-3 290 98 55 3 1
但是我想创建一个第九列,它从最初提取的字符串中获取值并将其应用于所有行,因此最终结果如下所示:
Mike Johnson MD 6-1 191 99 21 2 5 Red Team
Joe Smith VA 6-3 290 98 55 3 1 Red Team
a.) 提取值然后 b.) 将其作为第九列循环遍历所有行的最佳方法是什么?
【问题讨论】:
-
您能提供重现您的示例的网址吗?
-
@ANG 我很乐意,但不幸的是,出于隐私原因,我不能公开发布(输出结果只是虚拟数据,尽管在结构上看起来就是这样)。
-
@ANG 有没有办法可以私信别人?如果可能的话,请随意这样做,我可以在那里分享。我只是不把它公开。
标签: r web-scraping rvest stringr