在 Java 中解析各种自定义 XML 文档的最佳方法答案

【问题标题】：Best method to parse various custom XML documents in Java在 Java 中解析各种自定义 XML 文档的最佳方法
【发布时间】：2010-09-06 14:10:48
【问题描述】：

用 Java 解析多个离散的自定义 XML 文档的最佳方法是什么？

【问题讨论】：

向我们展示你已经走了多远——我们不会为你写的。你想用 DOM、SAX 还是其他的？到目前为止，您尝试过哪个？您看过哪些教程/文档？
使用 java dom api 或 sax 进行 xml 解析。给出更具体的 xml 结构。
尝试castor映射。
到目前为止你做了什么？你有代码给我们看吗？
如果效率是这样的话，我会使用 SAX 或根据个人喜好 - StAX

标签： java xml

【解决方案1】：

下面是使用vtd-xml提取一些值的代码。

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

【讨论】：

【解决方案2】：

你会想要使用org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html)。

【讨论】：

【解决方案3】：

使用dom4j 库

先阅读文档

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

然后使用 XPATH 获取您需要的值

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

【讨论】：

【解决方案4】：

如果您只需要解析，那么我建议您使用 XPath 库。这是一个很好的参考：http://www.ibm.com/developerworks/library/x-javaxpathapi.html

但您可能需要考虑将 XML 转换为对象，然后就没有限制了。为此，您可以使用XStream，这是一个很棒的库，我经常使用

【讨论】：

【解决方案5】：

基本上，Java 中有两种主要的 XML 解析方法：

SAX，您使用 handler 仅在 XML 中获取您想要的内容并放弃其余部分
DOM，它会一直解析您的文件，并允许您以更像树的方式抓取所有元素。

另一种非常有用的 XML 解析方法是StAX，尽管比这些方法更新一些，并且仅在 Java6 之后才包含在 JRE 中。 StAX 被认为是介于基于树的 DOM 和基于事件的 SAX 方法之间的一种中间方法。它与 SAX 非常相似，因为解析非常大的文档很容易，但在这种情况下，应用程序从解析器“拉”信息，而不是解析“推送”事件到应用程序。你可以在here找到更多关于这个主题的解释。

因此，根据您想要实现的目标，您可以使用其中一种方法。

【讨论】：

从我在重复线程上的答案中复制，以提供有关各种方法的更多信息

【解决方案6】：

我会使用Stax 来解析XML，它快速且易于使用。我在上一个项目中使用它来解析最大 24MB 的 XML 文件。 java.net 上有一个很好的介绍，它告诉您入门所需的一切。

【讨论】：