【发布时间】:2015-09-09 18:59:45
【问题描述】:
我想使用包rvest 从网页中提取汽油价格。但是,我无法拉取数值,必须通过 html 类.sp_p 拉取。
library(rvest)
desmoines <- html("http://www.desmoinesgasprices.com/")
拉动gas价格:
price <- desmoines %>%
html_nodes(".sp_p")
head(price, 3)
输出:
[[1]]
<div class="sp_p">
<div class="p2"></div>
<div class="pd"></div>
<div class="p5"></div>
<div class="p5"></div>
</div>
[[2]]
<div class="sp_p">
<div class="p2"></div>
<div class="pd"></div>
<div class="p5"></div>
<div class="p6"></div>
</div>
[[3]]
<div class="sp_p">
<div class="p2"></div>
<div class="pd"></div>
<div class="p5"></div>
<div class="p7"></div>
</div>
attr(,"class")
[1] "XMLNodeSet"
现在,我想使用包stringr 从网络抓取中提取数字,但我不能使用stringr,因为price 不是原子向量。我该如何解决这个问题?
【问题讨论】: