【发布时间】:2014-09-28 17:03:01
【问题描述】:
我是 python 和 SO 的新手。这是我的问题。
我正在尝试从以下网页NDBC - Station 46011. 中提取数据我一直在观看有关如何使用 BeautifulSoup 从网页中收集数据的教程,到目前为止我有以下代码:
import requests
from bs4 import BeautifulSoup
url = 'http://www.ndbc.noaa.gov/data/latest_obs/46011.rss'
r = requests.get(url)
soup = BeautifulSoup(r.content)
data_types = soup.find_all('strong')
for item in data_types:
print(item.text)
这为我提供了不同的数据类型(风向、速度、阵风等)。但是,我无法从此网页中提取数字数据。当您查看网页源代码时,您可以看到数字数据位于“strong”标签之后和“br”标签之前。由于它没有明确位于两个标签之间,因此我无法提取此数据。
提前感谢您的所有帮助!
【问题讨论】:
标签: python html beautifulsoup