【发布时间】:2016-12-04 00:19:33
【问题描述】:
我一直在做一个从这个IMDB网站提取数据的简单问题,但是因为我无法理解做这个问题的常用方法,所以我找到了自己的方法并卡住了。
我正在尝试获取名称和发布年份,html 代码如下所示:
<div class="a">
<div>
<div>
<div class="b">
<h3 class="c"><span class="d">1</span> <a href="link%20here">name of
movie</a> <span class="e">release year</span></h3>
</div>
</div>
</div>
</div>
现在我完成了名称提取,但我无法提取发布年份,请帮助
我的代码:
soup = BeautifulSoup(r.text)
item = soup.find_all("div" , {"class" : "a"})
for i in item:
title = i.find("div" , {"class" : "b"}).a
release_year = i.find("div" , {"class" : "b"}.span
print(title.get_text() , release_year.get_text())
输出如下:
(电影名称,'1)
我希望输出为
(电影名称,1990)
【问题讨论】:
标签: beautifulsoup imdb bs4