【发布时间】:2017-01-03 00:42:47
【问题描述】:
我正在尝试从篮球参考.com 上抓取球队统计网页,但是当我使用 readHTML 时,它只带回了前两个表格。
我的 R 代码如下所示:
url = "http://www.basketball-reference.com/leagues/NBA_2015.html"
teamPageTables = readHTMLTable(url)
这会返回一个只有 2 个的列表。页面上的前两个表。我希望有一个包含页面中所有表格的列表。
我也尝试过将 rvest 与我想要的表的 XPath(杂项统计表)一起使用,但也没有运气。
BBR 是否更改了某些内容以阻止抓取。我什至看过其他关于抓取团队网站的帖子,指出他想要的表格位于索引 16...我复制了他的代码,但仍然没有。
任何帮助将不胜感激。谢谢,
【问题讨论】:
标签: r web-scraping