【问题标题】:Best method to parse various custom XML documents in Java在 Java 中解析各种自定义 XML 文档的最佳方法
【发布时间】:2010-09-06 14:10:48
【问题描述】:

用 Java 解析多个离散的自定义 XML 文档的最佳方法是什么?

【问题讨论】:

  • 向我们展示你已经走了多远——我们不会为你写的。你想用 DOM、SAX 还是其他的?到目前为止,您尝试过哪个?您看过哪些教程/文档?
  • 使用 java dom api 或 sax 进行 xml 解析。给出更具体的 xml 结构。
  • 尝试castor映射。
  • 到目前为止你做了什么?你有代码给我们看吗?
  • 如果效率是这样的话,我会使用 SAX 或根据个人喜好 - StAX

标签: java xml


【解决方案1】:

下面是使用vtd-xml提取一些值的代码。

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

【讨论】:

    【解决方案2】:

    你会想要使用org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html)。

    【讨论】:

      【解决方案3】:

      使用dom4j

      先阅读文档

      import java.net.URL;
      
      import org.dom4j.Document;
      import org.dom4j.DocumentException;
      import org.dom4j.io.SAXReader;
      
      public class Foo {
      
          public Document parse(URL url) throws DocumentException {
              SAXReader reader = new SAXReader();
              Document document = reader.read(url);
              return document;
          }
      }
      

      然后使用 XPATH 获取您需要的值

      public void get_author(Document document) {
          Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
          String author = node.getText();
          return author;
      }
      

      【讨论】:

        【解决方案4】:

        如果您只需要解析,那么我建议您使用 XPath 库。这是一个很好的参考:http://www.ibm.com/developerworks/library/x-javaxpathapi.html

        但您可能需要考虑将 XML 转换为对象,然后就没有限制了。 为此,您可以使用XStream,这是一个很棒的库,我经常使用

        【讨论】:

          【解决方案5】:

          基本上,Java 中有两种主要的 XML 解析方法:

          • SAX,您使用 handler 仅在 XML 中获取您想要的内容并放弃其余部分
          • DOM,它会一直解析您的文件,并允许您以更像树的方式抓取所有元素。

          另一种非常有用的 XML 解析方法是StAX,尽管比这些方法更新一些,并且仅在 Java6 之后才包含在 JRE 中。 StAX 被认为是介于基于树的 DOM 和基于事件的 SAX 方法之间的一种中间方法。它与 SAX 非常相似,因为解析非常大的文档很容易,但在这种情况下,应用程序从解析器“拉”信息,而不是解析“推送”事件到应用程序。你可以在here找到更多关于这个主题的解释。

          因此,根据您想要实现的目标,您可以使用其中一种方法。

          【讨论】:

          • 从我在重复线程上的答案中复制,以提供有关各种方法的更多信息
          【解决方案6】:

          我会使用Stax 来解析XML,它快速且易于使用。我在上一个项目中使用它来解析最大 24MB 的 XML 文件。 java.net 上有一个很好的介绍,它告诉您入门所需的一切。

          【讨论】:

            猜你喜欢
            • 2015-08-21
            • 1970-01-01
            • 2018-01-17
            • 1970-01-01
            • 1970-01-01
            • 2010-10-28
            • 2010-09-13
            相关资源
            最近更新 更多