【发布时间】:2012-04-12 09:15:22
【问题描述】:
我查看了一些 Java HtmlParser(Jericho、HtmlCLeaner、...),但找不到在检索页面时将 html 框架标记替换为实际源代码的功能。
有没有人知道有什么解析器可以做到这一点?
答案:
像 Phani 表示我需要一个 Html Scraper(不是解析器,更清洁)
HtmlUnit 似乎可以解决问题:http://htmlunit.sourceforge.net/frame-howto.html
【问题讨论】:
标签: java html-parsing