【问题标题】:Jsoup - Get ParentJsoup - 获取父级
【发布时间】:2015-08-23 17:19:56
【问题描述】:

我有一些 HTML,我正在尝试获取链接,并且我知道我想要的链接将具有的一些品质,因此我可以轻松找到它,但我也想获得链接上方的 <h2 calss='locs'> 标签我有。所以html可能看起来像这样

<html>
    <body>
        <h2 class = 'locs'>text</h2>
        <p>
           <a link and stuff...>
        </p>
        <h2 class = 'locs'>foo</h2>
        <p>
           <a another link and stuff...>
        </p>
    </body>
</html>

&lt;h2&gt; 并不总是&lt;a&gt; 的第一个父级,所以有没有办法搜索链接之前的那个?

感谢您的帮助

【问题讨论】:

  • @speng10 我无法理解您的问题。你能重写你的问题吗?英语是乱码。也许把它分解成简短的句子。具体的细节和例子。

标签: java android html maven jsoup


【解决方案1】:

我不完全确定你在问什么,但这是我的假设:你想要 h2locs 之后的第一个 a 元素。

为此,您不能#t 使用parent() 方法,因为a 元素的父元素似乎是p 元素,它们又是h2.locs 元素的兄弟(而非子元素)。这是我会做的:

Elements as = doc.select("h2.locs + p>a");

解释:

  • h2.locs 查找具有类 locs 的 h2 元素
  • A + B 查找 B,它必须是前一个 A 的直接兄弟。
  • p&gt;a 寻找 a 的子元素 p

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-05-09
    • 2012-01-18
    • 1970-01-01
    • 2013-01-27
    • 1970-01-01
    • 1970-01-01
    • 2021-12-20
    • 2014-01-25
    相关资源
    最近更新 更多