【问题标题】:Scraping website without specific address抓取没有具体地址的网站
【发布时间】:2018-03-14 16:58:20
【问题描述】:

我正在尝试抓取一个不会为我想要抓取的不同页面生成特定网址的网站。这样做的原因是每个页面都是通过在某些组合框上选择不同的选项生成的,然后生成所需的表格。 是否可以使用 R 和 rvest 抓取这些表?

编辑:

这是一个具体示例的链接: http://www.odepa.gob.cl/precios/precios-al-consumidor-en-linea

【问题讨论】:

  • 不是直接简单的方式......
  • 添加了一个具体的例子,看看这些细节是否为 R 解决方案提供了任何帮助。

标签: r web-scraping rvest


【解决方案1】:

您可以使用 selenium webdriver 来控制 html 页面中的点击和动态数据。

试试这个:https://github.com/ropensci/RSelenium

【讨论】:

  • R 解决方案是否可行?
  • 如果你想抓取动态数据并自动点击,你必须使用 selenium。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2018-07-12
  • 2018-06-09
  • 2015-12-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多