【发布时间】:2011-01-09 07:49:30
【问题描述】:
soup.find("tagName", { "id" : "articlebody" })
为什么这不返回 <div id="articlebody"> ... </div> 标签和介于两者之间的东西?它什么也不返回。我知道它的存在是因为我正从
soup.prettify()
soup.find("div", { "id" : "articlebody" }) 也不起作用。
(编辑:我发现 BeautifulSoup 没有正确解析我的页面,这可能意味着我尝试解析的页面在 SGML 或其他格式中的格式不正确)
【问题讨论】:
-
(对于您的编辑,即使解析器在您的特定页面上不起作用,这个问题仍然对其他人具有可重用资源的价值)
标签: python beautifulsoup