【发布时间】:2011-09-05 18:38:32
【问题描述】:
能否请任何人推荐能够做与这些库相反的事情的库?
HtmlCleaner、TagSoup、HtmlParser、HtmlUnit、jSoup、jTidy、nekoHtml、WebHarvest 或 Jericho。
我需要构建 html 页面,从 String 内容构建 DOM 模型。
编辑:我需要它来进行测试。我有各种类型的输入/字符串,可能在各个地方的 html 页面中......所以我需要动态构建它......然后我根据必须满足或不满足的各种标准处理 html 页面。
我会告诉你我为什么问这个问题,考虑使用 htmlCleaner 来完成这项工作:
List<String> paragraphs = getParagraphs(entity.getFile());
List<TagNode> pNodes = new ArrayList<TagNode>();
TagNode html = cleaner.clean("<html/>");
for(String paragraph : paragraphs) {
TagNode p = new TagNode("p");
pNodes.add(p);
// CANNOT setText() ?
}
html.addChildren(pNodes);
问题是TagNode 有getText() 方法,但没有setText() 方法....
请添加更多关于这个问题有多模糊的 cmets……你能做的最好的事情
【问题讨论】:
-
那些库的反面?这不是一个模糊的问题吗?
-
不,不是,这些库的主要目标是解析 html 页面和创建 DOM 表示。我需要完全相反的东西。我必须构建它们,构建 dom 模型并从中创建一个文件...
标签: java html dom htmlcleaner