【问题标题】:Java Jsoup: How should I extract the following data point from this html?Java Jsoup:我应该如何从这个 html 中提取以下数据点?
【发布时间】:2015-08-02 12:28:01
【问题描述】:

我正在尝试从以下内容中提取最新信息:

下面是我正在查看的 html 代码,但我不知道如何使用 Jsoup 解决这个问题?问题是 html 中有许多名为“UL1”的类、多个“Last”和许多“td”。 在这种情况下,我需要获取当前价格,即“31.4”。

<td rowspan="2" class="bg1 W1">
           <ul class="UL1"><li class="LI1 font12_grey W1">Last</li></ul>
           <ul class="UL1"><li class="LI2 font28 C bold W1"><span class="neg bold">31.400</span></li></ul>
           <ul class="UL1 none" style="display:none;"><li class="LI1 C W1">
          <img src="/en/Images/Stock/icon_see.gif" border=0 /><a id="ctl00_ctl00_cphContent_cphContent_lnkAddMonitor" class="font12a" href="#">Monitor</a><img src="/en/Images/Stock/icon_group.gif" border=0 /><a id="ctl00_ctl00_cphContent_cphContent_lnkAddPortfolio" class="font12a" href="#">Portfolio</a> 
           </li></ul>
           </td>

【问题讨论】:

    标签: java jsoup data-extraction


    【解决方案1】:

    您可以查找包含文本 Lastul 元素,然后找到下一个兄弟:

    ul:contains(Last) + ul>li>span
    

    你可以找到一个演示here

    【讨论】:

    • 您好,我想问一下您的代码中的“:”和“>”是什么意思?我仍在尝试弄清楚如何使用 jsoup。谢谢
    • @mynameisJEFF:您可以在 Jsoup 指南中找到答案:jsoup.org/apidocs/org/jsoup/select/Selector.html
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-11-27
    • 1970-01-01
    • 2020-10-29
    • 1970-01-01
    • 2013-02-09
    • 2011-07-14
    相关资源
    最近更新 更多