【发布时间】:2012-03-18 08:42:50
【问题描述】:
我正在尝试让 BeautifulSoup 执行以下操作。
我有想要修改的 HTML 文件。我对两个标签特别感兴趣,我称之为 TagA 的标签是
<div class ="A">...</div>
还有一个我称之为 TagB
<p class = "B">...</p>
这两个标签在整个 HTML 中独立出现,它们本身可能包含其他标签并嵌套在其他标签中。 我想在每个 TagA 周围放置一个标记标记,只要 TagB 没有立即跟随,这样
<p class="A"">...</p> becomes <marker><p class="A">...</p></marker>
但是当 TagA 紧跟在 TagB 之后时,我希望标记 Tag 将它们都包围起来
这样
<p class="A">...</p><div class="B">...</div>
becomes
<marker><p class="A">...</p><div class="B">...</div></marker>
我可以看到如何选择 TagA 并用标记标记将其括起来,但是当它后面跟着 TagB 时,我不知道 BeautiulSoup 的“选择”是否或如何扩展以包含 NextSibling。 任何帮助表示赞赏。
【问题讨论】:
标签: python html beautifulsoup