提取body的属性，同时保留相对标签答案

【问题标题】：Extracting body's attribute, by also keeping the relative tag提取body的属性，同时保留相对标签
【发布时间】：2021-09-27 23:20:11
【问题描述】：

我正在尝试遍历 HTML 正文，以便找到所有 <h1> 标签：

Element body = docJSoup.body();
Elements mainCmp = body.select("h1");

所以，考虑到这个身体的片段：

<h1><span style='mso-bookmark:_Toc283737133'><span
style='mso-spacerun:yes'></span><span style='mso-spacerun:yes'></span><a
name="_Toc35343186"></a><a name="_Toc264704629"></a><span style='mso-bookmark:
_Toc35343186'>3<span style='mso-tab-count:1'></span>Aspetti metodologici</span></span></h1>

我会得到这个：

<span style="mso-bookmark:_Toc283737133"><span style="mso-spacerun:yes"></span><span style="mso-spacerun:yes"></span><a name="_Toc35343186"></a><a name="_Toc264704629"></a><span style="mso-bookmark:
_Toc35343186">3<span style="mso-tab-count:1"></span>Aspetti metodologici</span></span>

顺便说一句，我还想在结果中保留<h1> 标签。 <h1> 标签本身也可以有其他属性，所以我不能只是将"<h1>" 连接到结果字符串。有没有办法使用 JSoup 方法保留它？

感谢您提供任何见解。

【问题讨论】：

使用 parent 属性可能会有所帮助
@NadirBaoun：谢谢，但康斯坦丁的回答是直截了当的解决方案。

标签： java html jsoup

【解决方案1】：

outerHtml() 将为您提供节点的标记，包括它自己的开始和结束标记。

【讨论】：