【问题标题】:TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [closed]TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]
【发布时间】:2011-07-08 05:05:23
【问题描述】:

可供选择(并坚持使用)的大量 HTML 解析器令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最符合以下要求的:

  1. 成熟(bug 比其他人少)
  2. 活着和呼吸(即 维护)
  3. 快速且资源高效 (旨在在 Android 上运行)

根据您的经验,您会推荐哪种 HTML 解析器(以满足上述要求)以及为什么?

【问题讨论】:

  • @George Bailey 谢谢。这是个很棒的资源。您正确理解我正在寻找适用于 Android 的 最佳 解决方案。即 Jsoup 在桌面/服务器上可能很棒,但对于手机来说,也许不同的软件包会更好。
  • 更新:感谢@George Bailey 的链接,我找到了另一个资源:stackoverflow.com/questions/3152138/…
  • 您是否找到任何适合 Android 的合适的 html 解析器?我目前正在使用 JSoup。效果很好,但我想知道它是否可以进一步优化。
  • @Enigma AFAIAC Jsoup 是最好的。我可能不知道有什么更好的东西,但是项目生产力决定了我不能不断地从一个库切换到另一个库……:)

标签: java android html-parsing


【解决方案1】:

嗯,我找到了答案,这是@BalusC 在different thread 上给出的:

  1. 如果您只想使用基于 XML 的 遍历它的工具:JTidy
  2. 如果您想对 HTML 进行单元测试: HtmlUnit
  3. 如果您想提取特定数据 来自 HTML:Jsoup

谢谢@BalusC。

【讨论】:

    猜你喜欢
    • 2017-06-20
    • 2012-08-07
    • 1970-01-01
    • 2023-04-09
    • 2013-03-13
    • 2014-09-02
    • 2016-09-19
    • 2010-09-27
    相关资源
    最近更新 更多