【发布时间】:2016-01-21 14:28:58
【问题描述】:
我正在做一个项目,我必须能够知道一个元素有重复的子元素。例如在那个 DOM 中,我想知道元素 tbody 有相似的子元素
我的目标是从我忽略其结构的页面中提取数据并将其存储在数据库中。
【问题讨论】:
我正在做一个项目,我必须能够知道一个元素有重复的子元素。例如在那个 DOM 中,我想知道元素 tbody 有相似的子元素
我的目标是从我忽略其结构的页面中提取数据并将其存储在数据库中。
【问题讨论】:
您可以为此使用JSOUP。它也很容易使用
例如,您想在文档中获取所有 td 标记:
String html=... //your html string
Document doc = JSoup.parse(html);
Elements elements = doc.select("tbody").select("td");
System.out.println(elements.size()); //prints number of td within tbody REGARDLESS of where in the DOM tree they live.
编辑1:
获取您可以做的所有元素:
for(Element e : doc.getAllElements){
System.out.println(e.getTagName());//prints the tag name
}
【讨论】:
tbody,你可以搜索td,如果你不是在寻找特定的标签你可以选择everything跨度>