【发布时间】:2014-11-13 04:29:29
【问题描述】:
我有一个 HTML 文件:
<div>
DIV1
<div>
DIV2
<div>
DIV3
</div>
</div>
</div>
我想解析那个 HTML。但是我不想将整个解析的 HTML 作为字符串:
DIV1 DIV2 DIV3
我想逐个元素地获取值,但没有一个是重复的。我的意思是我不想这样:
当你得到第一个 div 的值时,它是:
DIV1 DIV2 DIV3
秒 div 的值:
DIV2 DIV3
第三个div的值:
DIV3
我不想要的结果是:
DIV1 DIV2 DIV3
DIV2 DIV3
DIV3
我想要那个结果:
DIV1
DIV2
DIV2
我将对它们应用一些程序,并且我也不想要重复的值。我想使用 Java 解析器来解决我的问题。我考虑过使用 Jsoup,但使用它时会解析整个 HTML。
【问题讨论】: