【发布时间】:2022-01-19 07:05:49
【问题描述】:
我开始为我的俱乐部编写抓取脚本。我希望创建一个脚本,可以收集俱乐部球队的所有数据,让我的数据分析更容易。我正在处理下面的代码,但是我正在努力从“actaEquipos”中获取文本。我的代码应该收集主队和客队,稍后我会将它们添加到 Excel 表中,但我卡在了第一步。
from bs4 import BeautifulSoup
from bs4.element import Stylesheet
import requests, openpyxl
excel = openpyxl.Workbook()
print(excel.sheetnames)
sheet = excel.active
sheet.title = "Acta Partido"
print (excel.sheetnames)
try:
source = requests.get('https://www.fcf.cat/acta/2022/futbol-11/cadet-primera-divisio/grup-2/1c/sant-ignasi-ce-a/1c/lhospitalet-centre-esports-b')
source.raise_for_status()
soup = BeautifulSoup(source.text,'html.parser')
actaEquipos = soup.find_all('div', class_='acta-equip')
actaMarcador = soup.find('div', class_='acta-marcador').text
acta = soup.find_all('table', class_='acta-table')
print(actaEquipos)
for equipo in actaEquipos:
nombreEquipo = equipo.find('span', class_='tr').txt
print(nombreEquipo)
print(len(actaEquipos))
break
except Exception as e:
print(e)
excel.save('ActaPartido.xlsx')
谁能帮我理解我错过了什么?
谢谢
【问题讨论】:
-
仅供参考,它是 scraping (以及scrape,scraper,scraped)而不是scraping。报废意味着像垃圾一样扔掉,或者打架。
标签: python python-3.x web-scraping beautifulsoup