【发布时间】:2019-06-22 02:31:58
【问题描述】:
我正在尝试从 URL 中抓取日期。数据不在 HTML 表格中,因此 pandas.read_html() 没有提取它。
网址是: https://www.athlinks.com/event/1015/results/Event/638761/Course/988506/Results
我想获得的数据是过去 5000 场比赛的表格性别、年龄、时间(名称并不重要)。数据一次在网页 50 中呈现大约 25 页。
它为 UI 使用各种 javascript 框架(node.js、react)。使用 chrome 浏览器中的“What Runs”插件发现了这一点。
这就是我想要获取这些数据的真正原因。我是一名新跑步者,下周将参加这个 5k,我想探索一些过去面孔的分布统计数据(这是一年一度的比赛,数据可以追溯到 1980 年代)。
提前致谢!
【问题讨论】:
标签: python pandas parsing web-scraping python-requests