【发布时间】:2020-04-11 21:32:22
【问题描述】:
我正在使用以下 NCAA 统计网站并希望从中获取数据:
https://stats.ncaa.org/rankings/change_sport_year_div
要获取我要抓取的具体数据,请点击链接,选择男子篮球运动,2019-2020 年和 Division III,然后点击球队统计按钮。 html,我能够从我想要的下拉菜单中找到所有统计信息。我想知道是否有可能使用 BeautifulSoup(甚至可能是 pd.read_html())来为每个类别抓取一个表。看起来我可能需要的所有信息都在下图中,但我不太确定如何实现 python 的工具来大写。这将比手动下载每个统计数据的 excel 表并将它们读入 pandas 更有效(并且不那么无聊)。谢谢。
【问题讨论】:
标签: python html pandas web-scraping beautifulsoup