【发布时间】:2017-01-20 15:18:20
【问题描述】:
我想使用 jsoup 解析这个 HTML,但我需要在不使用“更改类名”类的情况下提取标题和副标题,因为类名总是在变化。我只需要来自“h1”属性和“p”的文本
HTML:
<header class="my header">
<div class="row">
<h3>I don't want this </h3>
<div class="Changing class name">
<h1>The headline </h1>
<p class=" my subtitle">
The subtitle
</p>
</div>
</div>
</header>
【问题讨论】:
-
我不太了解 JSoup,但如果您不想使用该类,您可能必须确保结构始终相同,然后通过它们的路径访问元素,即
header.div.div.h1和header.div.div.p(如果有多个 div,你可能还需要一个常量索引)。