【问题标题】:Capturing onclick with rvest使用 rvest 捕获 onclick
【发布时间】:2016-03-10 05:39:29
【问题描述】:

我一直在努力使用 rvest 获取一条数据。我正在寻找的数据是值 20960,它位于 OpenView(20960) 内部。我将如何使用 rvest 完成此任务?

我正在使用的 html 的示例部分是

<tr class="row-1" align="left">
<td style="width:120px;">
<a href="#" onclick='OpenView(20960 );return false;'>
BAKER, JAIME EDWARD</a>
</td>
</tr>

【问题讨论】:

标签: r rvest


【解决方案1】:

我认为这需要一点 grepping...

library("rvest")
library("stringr")
read_html('<tr class="row-1" align="left">
<td style="width:120px;">
          <a href="#" onclick=\'OpenView(20960 );return false;\'>
          BAKER, JAIME EDWARD</a>
            </td>
            </tr>') %>% 
  html_nodes("a") %>% 
  html_attr("onclick") %>%
  str_extract("(?<=\\().*(?=\\))") %>%    # returns the stuff inside the parens
  str_trim(side="both")                   # trims whitespace from both sides
  [1] "20960"

【讨论】:

  • 那行得通。我没有考虑在 html_attr 之后需要做一些 grepping。我在这方面还是有点新意。谢谢你教我一些新东西并回答我的问题。非常感谢。
猜你喜欢
  • 1970-01-01
  • 2022-01-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-01-01
  • 1970-01-01
  • 2013-06-27
  • 1970-01-01
相关资源
最近更新 更多