【问题标题】:How to define XPATH value as a variable inside html_nodes in rvest in R如何在 R 的 rvest 中将 XPATH 值定义为 html_nodes 内的变量
【发布时间】:2016-06-19 11:45:48
【问题描述】:

在使用 R (rvest) 进行网络抓取时,我需要将 XPATH 值定义为 html_nodes 中的变量。这样我就可以遍历许多 XPATH。当我在外部定义 XPATH 时,它会引发错误(例如,当 xpath = //*[@id="banner"] 时出现错误)。能否请你帮忙。 我的代码:

xpath <- as.character('//*[@id="title-overview-widget"]')
      name <- lego %>% 
      html_nodes(xpath) %>%
      html_text()
Error Message : Error in tokenize(css) : Unexpected character '/' found at position 1

【问题讨论】:

    标签: r xpath rvest


    【解决方案1】:

    html_nodes 具有三个参数:文档、css 选择器和 xpath 选择器。通过在%&gt;% 链中使用它,您将使用文档填充第一个参数,但随后您设置的第二个参数是 css 选择器(这就是错误消息与 CSS 相关的原因),而不是 xpath 选择器。您应该使用命名参数来解决此问题

    name <- lego %>% 
          html_nodes(xpath=xpath) %>%
          html_text()
    

    【讨论】:

      猜你喜欢
      • 2018-07-15
      • 2020-11-30
      • 1970-01-01
      • 2017-11-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多