【发布时间】:2016-05-07 09:22:07
【问题描述】:
我有一些像这样的html:
<p>text1 </p>
<p><img src="http://theSite.com/apple.png" alt="apple-touch-icon-144x144-precomposed" /></p>
<p><img src="http://theSite.com/sony.gif" alt="cool" /></p>
<p style="text-align: center;">Second Text </p>
<p><img src="http://theSite.com/img.jpg" alt="2" /></p>
<p> </p>
<p style="text-align: left;">TextAgain </p>
我需要在列表或数组中获取元素名称和一些属性。 只是标签的名称(如 p)和标签之间的文本以及 img 标签的 src 属性。
像这样:
String[] elements = {
"p",
"p",
"img",
"p",
"img"
}
String[] values = {
"text1 ",
"<img src=...",
"http://thesite.com/apple.png",
"<img src=...",
"http://thesite.com/sony.gif"
}
有没有像 Jsoup 这样的库或任何方法来做到这一点?
【问题讨论】:
-
你研究过 Jsoup 提供的 CSS 选择器吗? jsoup.org/cookbook/extracting-data/selector-syntax
标签: android html regex html-parsing jsoup