【发布时间】:2020-09-18 03:27:03
【问题描述】:
我是爬虫新手,还在学习。使用 Python 将 MLB 首发阵容解析为 Pandas DataFrame 的最佳方法是什么?
这是我在这里的一次尝试:
import pandas as pd
import requests
from bs4 import BeautifulSoup
url = 'https://www.baseballpress.com/lineups'
headers = {'User-Agent':
'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36'}
df = pd.read_html(url)
print(df)
我收到一个错误:
ValueError: No tables found
每支球队有 1 名投手和 9 名击球手,每场比赛有 2 支球队(因此每场比赛共有 20 名球员)。
这是我正在寻找每个团队的输出示例:
Seth Lugo
Brandon Nimmo
Michael Conforto
J.D. Davis
Dominic Smith
Robinson Cano
Pete Alonso
Jeff McNeil
Andres Gimenez
Robinson Chirinos
这是数据的图片:
提前感谢您提供的任何帮助。非常感激。 =)
【问题讨论】:
标签: python pandas dataframe web-scraping