【发布时间】:2012-10-26 22:32:21
【问题描述】:
我正在尝试从诸如this 之类的页面中删除一些繁琐的文本。我想保留锚定链接但丢失中断和 a.intro。我以为我可以使用 unwrap() 之类的东西来剥离层,但出现错误:TypeError: 'NoneType' object is not callable
为了好玩,我尝试运行文档示例代码本身,因为我看不出我的版本有何不同。
markup = '<a href="http://example.com/">I linked to <i>example.com</i></a>'
soup = BeautifulSoup(markup)
a_tag = soup.a
a_tag.i.unwrap()
a_tag
# <a href="http://example.com/">I linked to example.com</a>
我得到了完全相同的错误。我在这里想念什么?我在 Scraperwiki 工作,fwiw。
【问题讨论】:
-
这似乎是一个 Scraperwiki 问题。例如,
unwrap示例在从 IPython 运行时有效。
标签: python web-scraping beautifulsoup scraperwiki