【发布时间】:2020-08-15 12:55:51
【问题描述】:
我是python的超级新手,这个网站在这个学期帮助了我很多,我希望你们能再次帮助我。
我需要从https://money.cnn.com/data/hotstocks/ 中抓取表格。
这些牌桌是最活跃的、赢家的和输家的。
现在我可以让这段代码为我工作了
import requests
from bs4 import BeautifulSoup
url = 'http://money.cnn.com/data/hotstocks/index.html'
response = requests.get(url)
html = response.content
soup = BeautifulSoup(html)
all_stock = soup.find('div', attrs={'id':'wsod_hotStocks'})
table = all_stock.find('table',attrs={'class':'wsod_dataTable wsod_dataTableBigAlt' })
for row in table.findAll('tr'):
for cell in row.findAll('td'):
print(cell.text)
但这只会让我获得最活跃的表格,我不确定我需要做什么才能让我的代码获得网站上的其他 2 个表格。
如果我能提供任何关于我做错了什么以及如何解决它的见解,我将不胜感激。
我不知道我是否必须创建代码来抓取每个表,或者我是否可以调整我所拥有的。
[这是来自网站的 HTML,因此你们可以了解我在做什么。 1
【问题讨论】:
-
您已经知道如何使用
.findAll循环遍历所有表格行和表格单元格 - 为什么不使用相同的方法循环遍历所有表格?
标签: python beautifulsoup python-requests