【发布时间】:2020-02-22 07:51:48
【问题描述】:
我正试图弄清楚将我的网页抓取转换为 CSV 的下一步是什么。
我尝试将每一列放入单独的列表中,但我觉得这不是解决方案。
from bs4 import BeautifulSoup
import requests
url = 'https://www.pro-football-reference.com/years/2018/passing.htm'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
for row in tb.find_all('tr'):
i = row.get_text()
print(i)
【问题讨论】:
-
下一步:
import csv -
最好将每一行放在单独的列表中,然后使用模块
csv和writerow(list)或writerows(list_of_lists) -
对我来说,预期的结果应该是什么样子并不明显。你能提供你想要的最终 CSV 的 sn-p(并解释你是如何得到它的)吗?谢谢。
-
@ggorlen 预期的结果是 csv 看起来像表格。
-
很公平,谢谢。你想要每 30 行的标题,还是只在顶部?
tb未在您的代码中定义,顺便说一句。
标签: python python-3.x csv web-scraping beautifulsoup