【发布时间】:2023-04-06 21:40:01
【问题描述】:
是的,我知道有类似的问题,我已阅读答案并尝试了我可以实施的答案。所以,如果问题很愚蠢,请提前抱歉:)
我正在从路透社获取公司董事会成员的年龄以获取公司列表。 这是链接:http://www.reuters.com/finance/stocks/companyOfficers?symbol=MSFT
我正在使用 rvest 库和 selectorgadget 来找到合适的 CSS 选择器。 代码如下:
library(rvest)
d = read_html("http://www.reuters.com/finance/stocks/companyOfficers?symbol=GAZP.RTS")
d %>% html_nodes("#companyNews:nth-child(1) td:nth-child(2)") %>% html_text()
结果是
character(0)
我认为我的 CSS 选择器有误。能告诉我怎么选表吗?
【问题讨论】:
-
" 未经我们事先书面同意,您不得删除、更改、转发、抓取、复制、出售、分发、转发、创建衍生作品或以其他方式将内容提供给第三方," 除非你能提供其他文件,否则你不太可能这样做是为了自己的启迪。
-
我这样做是为了我的论文(董事会经验〜公司业绩)。因此,我不会将内容提供给第三方。不过,谢谢你的这一点。我会问他们是否可以为此目的使用汇总数据。我也相信我可以自己使用这些数据,因为我的组织订阅了他们的服务。
标签: r web-scraping css-selectors html-parsing rvest