【发布时间】:2014-05-04 14:55:46
【问题描述】:
from bs4 import BeautifulSoup
import requests
url ="http://www.basketnews.lt/lygos/59-nacionaline-krepsinio-asociacija/2013/naujienos.html"
r = requests.get(url)
soup = BeautifulSoup(r.text)
naujienos = soup.findAll('a', {'class':'title'})
print naujienos
这是 HTML 的重要部分:
<div class="title">
<a href="/news-73147-rockets-veikiausiai-pasiliks-mchalea.html"></a>
<span class="feedbacks"></span>
</div>
我得到空列表。我的错在哪里?
编辑:
谢谢它的工作。现在我想打印新闻标题。这就是我正在尝试的方式:
nba = soup.select('div.title > a')
for i in nba:
print ""+i.string+"\n"
我获得最多 5 个标题并出现错误:无法连接 'str' 和 'NoneType' 对象
【问题讨论】:
-
也许标签'a'应该有这个类。
标签: python beautifulsoup