读取 XML 元素的内部 XML答案

【问题标题】：Read Inner XML of a XML Element读取 XML 元素的内部 XML
【发布时间】：2013-10-06 17:28:12
【问题描述】：

我正在查看 StackOverflow，但找不到最佳答案。我需要在 JAVA 中读取 XML 文件。我的 XML 文件如下所示：`

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<server>
    <server01>
       <department>A1</department>
       <department>A2</department> 
    </server01>
    <server02>
       <department>A1</department>
       <department>A2</department> 
    </server02>
</server>

是否可以读取<server01> 和<server02> 之间的Java 元素，不包括文件的其余部分？或者我需要使用不同的标签？我找到了如何读取父节点的方法：

NodeList serversNames = xmlD.getDocumentElement().getChildNodes();

for (int i = 0; i < serversNames.getLength(); i++) {
    Node node = serversNames.item(i);
    if (node instanceof Element) {
        Element childElement = (Element) node;
        System.out.println("tag name: " + childElement.getTagName());
    }
}

我能够读取所有部门标签并将它们保存到数组中：

NodeList serverName = xmlD.getElementsByTagName("department");

serversList = new String[serverName.getLength()];

System.out.println("zasieg: " + serverName.getLength());

for (int temp = 0; temp < serverName.getLength(); temp++) {
    Element shareName = null;

    shareName = (Element) serverName.item(temp);

    serversList[temp] = shareName.getTextContent();
    System.out.println(temp + " - " + serversList[temp]);
}

那么，是否有可能只读取父节点的元素？仅 SERVER01 的元素？

【问题讨论】：

你是说你在读完的内容后要停止阅读文档，而不是读入的内容吗？我认为您需要在程序中定义该逻辑，它不会真正成为任何 XML 解析器的一部分。
不清楚您要做什么或问题是什么。你不能只使用 XPath 或等效的吗？如果你使用事件驱动的解析器，你可以随时停止，如果它真的值得的话。
您可以使用xstream将XML转为对象，将对象转为XML，非常简单的方法将XML转为对象，将对象转为XML。
这是一个有用的参考：viralpatel.net/blogs/java-xml-xpath-tutorial-parse-xml
@MattN：不正确。解析 XML 标记有 2 种方法：DOM（将整个文件读入树形数据结构）和 SAX（在文件中流式传输并处理在解析过程中遇到的标签）。听起来像提前终止的基于 SAX 的 xml 解析方法会很好地满足 OP 的需求。见stackoverflow.com/questions/6828703/…

标签： java xml

【解决方案1】：

XPath 是你想要的。出于所有意图和目的，您可以将 xpath 视为 sql，只是它用于 xml 文档而不是数据库。这是一个使用 Java 的简单示例（请记住，xpath 是一个标准，并非特定于 java，因此您可以在几乎任何流行语言中找到许多方法）：

    // Load document
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document doc = builder.parse( new FileInputStream( "/tmp/xml" ) );

    // Create XPath expression
    XPathFactory xPathfactory = XPathFactory.newInstance();
    XPath xpath = xPathfactory.newXPath();
    XPathExpression expr = xpath.compile( "//server01" );

    // Find node 'server01'
    Node node = (Node) expr.evaluate( doc, XPathConstants.NODE );
    if( node == null ) {
        System.out.println( "Node not found" );
        System.exit( 0 );
    }

    // Extract departments
    Element server01 = (Element) node;
    for( int k = 0 ; k < server01.getChildNodes().getLength() ; k++ ) {
        Node childNode = server01.getChildNodes().item( k );
        // Check if current node is a department node
        if( "department".equals( childNode.getNodeName() ) ) {
            System.out.println( childNode.getNodeName() + ": " + childNode.getTextContent().trim() );
        }
    }

有没有可能避免这种情况？

是的，只需将 XPath 表达式更改为只接收您需要的节点。

// Load document
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse( new FileInputStream( "/tmp/xml" ) );

// Create XPath expression
XPathFactory xPathfactory = XPathFactory.newInstance();
XPath xpath = xPathfactory.newXPath();
XPathExpression expr = xpath.compile( "//server01/department" );

// Find nodes 'department' under node 'server01'
NodeList node = (NodeList) expr.evaluate( doc, XPathConstants.NODESET );

// Extract departments
for( int k = 0 ; k < node.getLength() ; k++ ) {
    Node childNode = node.item( k );
    // Check if current node is a department node
    if( "department".equals( childNode.getNodeName() ) ) {
        System.out.println( "[" + k + "] " + childNode.getNodeName() + ": " + childNode.getTextContent().trim() );
    }
}

你必须收到下一个输出：

[0] department: A1
[1] department: A2

【讨论】：

为了确保我不会因为我的编辑而从你那里拿分，我已经删除了我的答案并给了你一个赞成票，因为我们基本上有相同的答案。
嗨。这是第一个简单的解决方案。我并不感到惊讶，我并不孤单:)
谢谢！这是非常有帮助的:)。但是，有一件事，就是不明白。程序的输出是：null 1 - AP null 3 - AR null 5 - GL null 7 - CS null 9 - CL 为什么这样算？不是 1,2,3... 而是只有奇数？
你改变了原来的例子吗？我已经测试过了，输出显示正确的行：department: A1
您在奇数迭代中收到 'department' 节点，因为标签之间存在带有 '\n' 内容的 '#text' 节点。