【发布时间】:2015-04-06 18:04:10
【问题描述】:
我对 BeautifulSoup 不是很熟悉。 我有类似的 html 代码(它只是其中的一部分):
<div class="central-featured-lang lang1" lang="en">
<a class="link-box" href="//en.wikibooks.org/">
<strong>English</strong><br>
<em>Open-content textbooks</em><br>
<small>51 000+ pages</small></a>
</div>
关于我应该得到的输出(以及其他语言):
English: 51 000+ pages.
我尝试了类似的方法:
for item in soup.find_all('div'):
print item.get('class')
但这不起作用。你能帮助我,或者至少能找到解决办法吗?
【问题讨论】:
标签: python html parsing beautifulsoup