【发布时间】:2016-03-22 14:08:30
【问题描述】:
以下代码提供了如下所示的 HTML 代码:
from urllib.request import urlopen
from bs4 import BeautifulSoup
# open webpage
url = "https://www.google.com/finance?cid=12377955"
pageSource = urlopen(url).read()
# parse HTML into Beautiful Soup
savSoup = BeautifulSoup(pageSource, "html.parser")
# extract data from soup
divData = savSoup.find_all("span", class_= "pr")
print(divData)
---
这会在命令行中返回:
---
[<span class="pr">
<span id="ref_12377955_1">2.13</span>
</span>]
我在 2.13 之后 - 我从这里遵循了许多答案,但我得到的最接近的是仅删除 span 类标签 - 我似乎无法改变 id。
【问题讨论】:
标签: python html python-3.x web-scraping beautifulsoup