【发布时间】:2020-02-25 08:14:27
【问题描述】:
我已经解析了一个表格,并希望将其中两个变量转换为 Pandas Dataframe 以打印到 Excel。
仅供参考: 我确实问过类似的问题,但是没有得到彻底的回答。没有关于如何创建 Pandas DataFrame 的建议。这就是我问题的重点。
注意: 我解析的数据存在小问题。数据在输出中多次包含“TEAM”和“SA/G”。
我希望 DataFrame 中的第一个变量是“TEAM”。
我想要在 DataFrame 中的第二个变量是“SA/G”。
到目前为止,这是我的代码:
# imports
from selenium import webdriver
from bs4 import BeautifulSoup
# make a webdriver object
driver = webdriver.Chrome('C:\webdrivers\chromedriver.exe')
# open some page using get method - url -- > parameters
driver.get('http://www.espn.com/nhl/statistics/team/_/stat/scoring/sort/avgGoals')
# driver.page_source
soup = BeautifulSoup(driver.page_source,'lxml')
#close driver
driver.close()
#find table
table = soup.find('table')
#find_all table rows
t_rows = table.find_all('tr')
#loop through tr to find_all td
for tr in t_rows:
td = tr.find_all('td')
row = [i.text for i in td]
# print(row)
# print(row[9])
# print(row[1], row[9])
team = row[1]
sag = row[9]
# print(team, sag)
data = [(team, sag)]
print(data)
这是我希望使用 Pandas DataFrame 选项打印到 excel 的最终输出:
Team SA/G
Nashville 30.1
Colorado 33.6
Washington 31.0
... ...
提前感谢您提供的任何帮助。我仍在学习并感谢我能得到的任何反馈。
【问题讨论】:
标签: python pandas selenium dataframe parsing