【发布时间】:2022-01-22 02:01:18
【问题描述】:
我正在努力报废,并创建了以下代码。该网页有几个表(class="acta-table"),我想进一步深入研究。网页上有 12 个表格,我希望得到一些关于如何以不同方式处理每个表格的帮助。我想处理的 gols 和 target 表与 Titulars、Suplents、Equip Técnic 不同,...
from bs4 import BeautifulSoup
from bs4.element import Stylesheet
import requests
import openpyxl
excel = openpyxl.Workbook()
# print(excel.sheetnames)
sheet = excel.active
sheet.title = "Acta Partido"
sheet.append(['Equipo Local', '', '', 'Equipo Visitante'])
# print (excel.sheetnames)
try:
source = requests.get(
'https://www.fcf.cat/acta/2022/futbol-11/cadet-primera-divisio/grup-2/1c/sant-ignasi-ce-a/1c/lhospitalet-centre-esports-b')
source.raise_for_status()
soup = BeautifulSoup(source.text, 'html.parser')
actaEquipos = soup.find_all('div', class_='acta-equip')
actaMarcador = soup.find('div', class_='acta-marcador').text.split("-")
acta = soup.find_all(name='table', class_='acta-table')
actaTitulo = soup.find('span', class_='apex').text.split("-")
sheet.append([actaTitulo[0].strip(), actaMarcador[0].strip(),
actaMarcador[1].strip(), actaTitulo[1].strip()])
for titulars in acta:
print(titulars.getText())
except Exception as e:
print(e)
excel.save('ActaPartido.xlsx')
谢谢,
【问题讨论】:
-
您要从网站中提取哪个表?
-
Bhavya 正如我所提到的,我想以不同的方式处理每个表以附加到 Excel。对于表格(标题、补充、装备技术),我想提取每一行的名称并在 home 和 away 之间分开,但在(gols 和 targetes)我需要进行更多操作。
标签: python python-3.x web-scraping beautifulsoup