【发布时间】:2014-04-21 15:10:18
【问题描述】:
我想从使用 JAVA (Android) 的网站中提取 <div class="score">4.1</div> 的值。我尝试了Jsoup,尽管它使用起来再简单不过,但它在 8 秒内给了我价值,这非常慢。您需要知道,该站点的页面源有 300,000 个字符,而这个 <div> 位于中间。
即使使用 HttpClient 并将源代码放入 StringBuilder 然后遍历整个字符串直到找到 score 部分也会更快(3-4 秒)。
我无法试用 HtmlUnit,因为它需要大量的 jar 文件,而且过了一段时间 Eclipse 总是在它的混乱中惹恼自己。
有没有更快的方法?
【问题讨论】:
标签: java web-scraping