【发布时间】:2020-03-12 20:49:50
【问题描述】:
我对使用 R 进行网络抓取完全不熟悉,我想抓取下表(图像),它的行为类似于 tbody。如果我运行以下代码,我只会看到标题,没有数据(捷克语网站)。
我应该得到在那里下订单的时间、价格、数量和数量(捷克克朗)。
library(rvest)
library(dplyr)
PSE_Page <- "https://www.pse.cz/detail/CZ0003519753?tab=detail-trading-data"
Page <- read_html(PSE_Page)
Our_table <- Page %>%
rvest::html_nodes('body') %>%
xml2::xml_find_all("//div[contains(@class, 'stock-table large-table small-text page-block-negative-margin table-container js-swipe-icon')]") %>%
rvest::html_text()
Our_table
输出: 1 "\n Čas\n Cena\n Celkový objem\n Celkový objem\n **
有人可以帮忙吗?非常感谢!!!
【问题讨论】:
-
不清楚您要提取哪个表。您能否编辑您的帖子以包含网站的屏幕截图并突出显示您感兴趣的部分?
-
当我转到pse.cz/detail/CZ0003519753?tab=detail-trading-data 时,我在任何地方都看不到那张桌子。你能澄清一下吗?笼统地说:如果您处理评论(并编辑您的帖子),通常对留下原始评论的人进行 ping 操作会有所帮助。如果您在@MauritsEvers 的评论中联系我,我会收到通知;这使得及时沟通变得容易得多。
-
@MauritsEvers 好的,谢谢。
-
仍然不清楚你指的是哪个表。如果我访问您提供的网站,我看不到任何类似于您显示的内容。我错过了什么吗?
-
@MauritsEvers 如果你去底部,它是这个页面左边的底部表格:pse.cz/detail/CZ0003519753?tab=detail-trading-data
标签: r web-scraping dplyr rvest rselenium