【问题标题】:R web scraping without selenium or phantomjs没有硒或phantomjs的R网页抓取
【发布时间】:2021-07-19 02:29:01
【问题描述】:

我正在尝试在不使用 Selenium 或 PhantomJS 的情况下从 R 中的以下链接中抓取一些 COVID-19 指标。数据似乎没有存储在 JSON 中,所以我无法使用 jsonlite 来解决这个问题。我一直在尝试用 rvest 和 V8 抓取数据,但没有任何运气。一些帮助将不胜感激。谢谢!

https://novascotia.maps.arcgis.com/apps/dashboards/ae40521cdca44bb7995dc13bd1d9595e

【问题讨论】:

  • 请包含您当前最佳尝试的代码,并说明什么不起作用。并且这些数字是否必须来自该站点,因为有几个不错的 API/csvs 浮动。

标签: javascript html r web-scraping rvest


【解决方案1】:

这是一种不基于 phantomJS 或 Selenium 的方法:

library(pagedown)
library(pdftools)
chrome_print("https://novascotia.maps.arcgis.com/apps/dashboards/ae40521cdca44bb7995dc13bd1d9595e", "C:\\...\\test.pdf")
pdf_Text <- pdf_text("C:\\...\\test.pdf")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2023-02-02
    • 2017-12-29
    • 2021-04-13
    • 2020-03-27
    • 2018-03-22
    • 2021-03-30
    • 2019-04-15
    • 1970-01-01
    相关资源
    最近更新 更多