【发布时间】:2020-12-05 11:05:02
【问题描述】:
我正在学习使用 MLB 数据进行网络抓取。我只想要团队和 WAR 数据。我不确定如何仅解析我正在寻找的数据。我不想要团队记录或括号。任何帮助将不胜感激。
我希望创建一个具有所需输出的 Pandas DataFrame。
所需数据:1) 团队 2))WAR
所需的数据格式(下):
团队战争
ARI 1.3
ATL 1.87
BAL 2.60
BOS .43
import pandas as pd
url = 'https://www.baseball-reference.com/leagues/MLB/2020-team-starting-lineups.shtml'
test = pd.read_html(url)
for t in test:
team = t['Tm']
print(team)
我不确定如何解析额外的数据。提前感谢您的时间和建议。 =)
【问题讨论】:
标签: python pandas dataframe parsing web-scraping