【发布时间】:2020-03-01 17:06:49
【问题描述】:
我正在尝试从 https://www.transfermarkt.co.uk/premier-league/startseite/wettbewerb/GB1 抓取数据
我已使用此代码来执行此操作:
headers = {'User-Agent':
'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36'}
page = 'https://www.transfermarkt.co.uk/premier-league/startseite/wettbewerb/GB1'
pageTree = requests.get(page, headers=headers)
pageTree_text = pageTree.text
pageSoup = BeautifulSoup(pageTree_text, 'html.parser')
之后,我想找到与每个团队名称相关的所有链接,并使用此代码:
linkLocation = pageSoup.find_all("a", {"class": "vereinprofil_tooltip tooltipstered"})
linkLocation[0].text
输出:
IndexError Traceback(最近一次调用最后一次) 在 1 linkLocation = pageSoup.find_all("a", {"class": "vereinprofil_tooltip tooltipstered"}) ----> 2 链接位置[0].text
IndexError: 列表索引超出范围
为什么列表中没有任何链接?
谢谢!
【问题讨论】:
标签: python web-scraping