【问题标题】:How to compare children of an element in a DOM with jsoup如何将 DOM 中元素的子元素与 jsoup 进行比较
【发布时间】:2016-01-21 14:28:58
【问题描述】:

我正在做一个项目,我必须能够知道一个元素有重复的子元素。例如在那个 DOM 中,我想知道元素 tbody 有相似的子元素

我的目标是从我忽略其结构的页面中提取数据并将其存储在数据库中。

【问题讨论】:

    标签: java html parsing jsoup


    【解决方案1】:

    使用 Jquery 获取您的 td 元素并使用 each 对其进行迭代。

    【讨论】:

    • 请看我添加的评论
    【解决方案2】:

    您可以为此使用JSOUP。它也很容易使用

    例如,您想在文档中获取所有 td 标记:

    String html=... //your html string
    Document doc = JSoup.parse(html);
    Elements elements = doc.select("tbody").select("td");
    System.out.println(elements.size()); //prints number of td within tbody REGARDLESS of where in the DOM tree they live. 
    

    编辑1:

    获取您可以做的所有元素:

    for(Element e : doc.getAllElements){
      System.out.println(e.getTagName());//prints the tag name
    }
    

    【讨论】:

    • 谢谢,但在那种情况下,我知道我有一个名为 tbody 的元素,在我的项目中,我将不得不解析近 100 页,因此我无法知道之前的元素,它取决于页面本身。
    • @user200099 你不必特别检查tbody,你可以搜索td,如果你不是在寻找特定的标签你可以选择everything跨度>
    • 这是我的问题,如何选择所有内容?然后比较每个元素的子元素?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多