【发布时间】:2012-02-22 22:47:35
【问题描述】:
我需要解析一个包含简单表单的简单 HTML 页面。 StackOverflow 上类似问题的答案建议使用多种非标准 Java 库之一,例如 TagSoup、JSoup、HTMLParser 和许多其他库。
但是,网络搜索显示,Java SE 中存在一些通过此类的标准功能:http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
我的子问题是:
- 标准的 ParserDelegator 类真的可以解析像我这样的用例吗?
- 标准库的哪些限制导致需要如此多的非标准库?
- ParserDelegator 在 Swing 中这一事实是否会排除在常规 EC2 云服务器中用于 Web 应用程序的情况?我是否必须跳过很多圈才能绕过无头方面,或者这只是对配置的一个小调整?
- 如果不推荐标准的,我应该使用哪个非标准的,考虑到:(a) 我希望不偏离标准; (b) 我的简单用例; (c) 渴望成熟可靠的实施; (d) 没有尺寸或重量限制,因为这是一个服务器应用程序,而不是嵌入式客户端。 API 的优先级要低得多,所以虽然我很欣赏 JSoup 的 CSS 选择器(如 API),但 (a) 到 (d) 的其他问题会覆盖它。
谢谢。
【问题讨论】:
-
近距离投票者,请指出这是重复的内容(如果这是您近距离投票的原因)
标签: java html html-parsing html-parser