【发布时间】:2021-09-25 21:19:26
【问题描述】:
我正在尝试从 IMDb 中获取一些电视收视率,但找不到正确的 CSS 选择器。我尝试了几十种替代方法,并尝试使用 CSS 选择器小工具,但 R 正在返回 {xml_nodeset (0)} 值。
这是我的代码:
require(rvest)
read_html('https://www.imdb.com/title/tt0562992/?ref_=ttep_ep1') %>%
html_nodes('a.ipc-button ipc-button--single-padding ipc-button--center-align-content ipc-button--default-height ipc-button--core-baseAlt ipc-button--theme-baseAlt ipc-button--on-textPrimary ipc-text-button RatingBarButtonBase__Button-sc-15v8ssr-2 jjcqHZ')
我想要做的是提取嵌入在页面左上角评级中的 href。请参阅下面的图片,其中我突出显示了我希望在开发人员视图 CSS 中提取的 href。
有人可以帮我找出正确的选择器吗?
【问题讨论】:
-
尝试 'div[class^=hero-rating-bar] > a[class^=ipc-button]' 如果你想走 CSS 路线,这使用部分选择,所以 ^ 表示类开始。希望这会有所帮助!
标签: html r web-scraping css-selectors rvest