【发布时间】:2014-07-03 09:10:59
【问题描述】:
我正在尝试从 HTML 文档中获取文本
<p>
<b>1</b>First Text
<b>2</b><br>Second Text
<b>3</b>Third Text
.
.
.
.
</p>
第 3 行是卡住的地方
尝试使用以下代码,但出现错误。
Elements elements = doc.body().select("p").select("b");
for(int i=0; i<elements.size(); i++)
{
Element val = elements.get(i);
if ((val.nextSibling().toString().trim()).equals(""))
System.out.println(val.nextSibling().toString().select("br").first().text()+"\n");
else
System.out.println(val.nextSibling().toString()+"\n");
}
【问题讨论】:
标签: java html html-parsing jsoup