【发布时间】:2012-07-16 10:39:56
【问题描述】:
我用的是漂亮的汤,下面是我的代码
import urllib2
data = urllib2.urlopen("some_url")
html_data = data.read()
soup = BeautifulSoup(html_data)
href_tags = soup.findAll('a')
结果:
href_tags =
[<a href="http://www.exampl.com/score_card" target="_blank" style="font-family:arial;color:#192e94;">Click Here</a>,
<a href="https://example.icims.com/jobs/search?pr=5">what is this</a>,
<a href="https://example.com/search?pr=6">Cool</a>,
<a href="https://example.com/help/host/search?pr=7">Hello</a>]
但实际上我想从所有锚标签中提取href,我该如何提取href标签。
提前致谢…………
【问题讨论】:
-
@novus42:非常感谢您提供了更多信息
标签: python url beautifulsoup href urllib2