【发布时间】:2019-08-19 00:53:02
【问题描述】:
下面的链接页面有两个同名的类,其中包含数据。我正在尝试从中挖掘球员姓名并分配他们在锦标赛中的位置。 beautifulsoup 中的 find 函数只允许我抓取该类的第一个实例。
我尝试了几次不同的迭代尝试迭代类的第一个实例,但没有任何效果。有两个 Table2__tbody 实例似乎是问题所在,我如何通过第一个实例并从第二个实例中挖掘数据。
url_page = "https://www.espn.com/golf/leaderboard/_/tournamentId/401056502"
page = requests.get(url_page)
soup = BeautifulSoup(page.text, 'html.parser')
name_list = soup.find(class_='Table2__tbody')
name_list_items = name_list.find_all('a')
name_list 仅从 Table2__tbody 的第一个实例中捕获数据。我需要的只是第二个实例的数据。
【问题讨论】:
-
你似乎已经知道
find_all;你为什么不用它?
标签: python html css beautifulsoup