【发布时间】:2016-08-22 04:11:01
【问题描述】:
<div class="item-container">
<h4 class="title">Item 1</h4>
<h4 class="impact"><i class="exclamation point"></i>Impact:High</h4>
</div>
<div class="item-container">
<h4 class="title">Item 2</h4>
</div>
我需要一个 jsoup 大师。
我只想获取文本“Item 1”(只有 h4 和紧随其后的另一个类“impact”)。我该怎么做?
到目前为止,我只能从正确的类中获取所有 h4,但无法根据周围元素过滤输出:
import java.io.File;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class GetItem {
public static void main(String[] args) throws IOException {
File input = new File("D:\\html.html");
Document doc = Jsoup.parse(input, "UTF-8");
Elements div = doc.select("div.item-container");
Elements h4 = doc.select("div.item-container > h4.title");
for (int i = 0; i < h4.size(); i++) {
System.out.println("Item: " + h4.get(i).text());
}
}
}
【问题讨论】:
标签: jsoup