【发布时间】:2012-06-10 10:25:50
【问题描述】:
我正在尝试使用 JSoup 和 Java 从网站中提取某些特定数据。到目前为止,我已经成功地实现了我想要实现的目标。
<ul class="beverageFacts">
<li><span>Årgång</span><strong>**2009** </strong></li>
我想提取上面 HTML 中 ** 里面的内容。我可以通过使用 JSoup 中的代码来做到这一点:
doc.select("ul.beverageFacts li:lt(1) strong");
我使用 lt(1) 是因为后面还有几个我想省略的列表项。
现在是我的问题;我从中提取数据的网站上有一个可选的信息选项卡,它还有一个名为“beverageFacts”的类。我的代码现在也会提取该数据,我不希望它这样做。
代码在网站源代码的更下方,我也尝试在此处使用索引器 :lt(1),但它不起作用。
<div id="beverageMoreFacts" style="display: block">
<ul class="beverageFacts"><li class="half">
<span> Färg</span><strong> Ljusgul färg.</strong>
我的总体结果是我提取了“2009 Ljusgul färg”。而不仅仅是“2009”。如何编写我的代码,以便它只提取它成功完成的第一部分,而省略其余部分?
编辑: 我得到了同样的结果:
doc.select("ul.beverageFacts li:eq(0) strong");
谢谢, Z
【问题讨论】:
标签: java parsing selector jsoup