【发布时间】:2020-02-06 21:10:26
【问题描述】:
这是我的代码:
from urllib import urlopen
from bs4 import BeautifulSoup
import pandas as pd
url = "http://www.basketball-reference.com/draft/NBA_2014.html"
html = urlopen(url)
soup = BeautifulSoup(html)
column_headers = [th.getText() for th in soup.findAll('tr',limit=2)[1].findAll('th')]
data_rows = soup.findAll('tr')[2:]
player_data = [[td.getText() for td in data_rows[i].findAll('td')] for i in range(len(data_rows))] #PLAYER DATA
type(soup)
type(data_rows)
df = pd.DataFrame(player_data,columns=column_headers)
错误似乎出现在最后一行。
【问题讨论】:
-
您能否详细说明以使您的帖子更清晰?
-
请阅读How to create a Minimal, Complete, and Verifiable example。它将帮助您修改您的问题,以便您传达我们需要帮助您的信息。学习how to ask good questions 很痛苦,但值得付出努力。
-
我会以清晰的内容重新发布以上内容
-
“通过了 22 列,传递的数据有 21 列”非常自描述。