【问题标题】:How to access the attribute of a child element in java using jsoup?如何使用jsoup访问java中子元素的属性?
【发布时间】:2016-07-29 02:15:45
【问题描述】:
让我们假设 HTML 文件的格式,
<div>
<a href"something" title"something"></a>
</div>
我已经使用jsoup来获取所有的div标签,我只是想访问div的子元素。我使用了.html()方法,但是它返回一个字符串,我无法使用Elements下的方法进一步操作它。
【问题讨论】:
标签:
java
html
parsing
jsoup
【解决方案1】:
由于您已经将 div 作为元素,使用 CSS 选择器查找子元素,然后使用 attr(String) 访问属性。
Elements divs = doc.select("div");
for (Element div : divs)
String href = div.select("a").first().attr("href");
【解决方案2】:
试试这个例子
String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""
String linkOuterH = link.outerHtml();
// "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"