【发布时间】:2022-01-01 11:44:09
【问题描述】:
我想从网站“https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”中抓取数据
我尝试在 Python 上提取这些数据,但无法成功。我想用这些数据和相同的字段在 Python 上创建一个表。有人可以尝试帮助我使用 pandas、beautifulsoup ... 提取数据的脚本吗?
我已经试过了:
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
print(soup.prettify())
for i in soup.find_all("tr"):
print(i.find_all("td"))
print ("")
colonnes = ["Nom","Equipe","Buts","Matchs joués"]
df = pd.DataFrame(columns = colonnes)
df
for i in soup.find_all("tr")[1:]:
href = i.find_all("td")
df = df.append({'Nom': href}, ignore_index=True)
print(df.head())
【问题讨论】:
-
您能告诉我们您尝试了什么吗?
-
好的答案需要好的问题,请通过改进您的问题来帮助大家理解您的问题。通常,现有代码和预期结果应以文本形式呈现。另请阅读 --> 如何创建 minimal reproducible example 谢谢
-
这是我试过的! (在问题中)
标签: python web-scraping beautifulsoup