【发布时间】:2012-08-11 20:16:32
【问题描述】:
我有一个类似下面的 html 文件
...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...
在此我想将值提取为 A 和 B。
你能推荐任何可以轻松做到这一点的 java html 解析器库吗?
【问题讨论】:
标签: java html-parsing web-scraping
我有一个类似下面的 html 文件
...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...
在此我想将值提取为 A 和 B。
你能推荐任何可以轻松做到这一点的 java html 解析器库吗?
【问题讨论】:
标签: java html-parsing web-scraping
【讨论】:
text(),它给你span的内容。我已经编辑了我的答案。
span.attr("itemprop")是否等于A或B; 2)您可以运行两个选择,一个使用span[itemprop=A],另一个使用span[itemprop=B]。
JTidy 是一个名称混乱但受人尊敬的 HTML 解析器。
【讨论】:
JSoup 是要走的路。
【讨论】: