【问题标题】:XML Document to StringXML 文档到字符串
【发布时间】:2011-07-24 07:44:36
【问题描述】:

获取 XML 文档 (org.w3c.dom.Document) 的字符串表示的最简单方法是什么?也就是说,所有节点都将在一行上。

例如,来自

<root>
  <a>trge</a>
  <b>156</b>
</root>

(这只是一个树表示,在我的代码中它是一个org.w3c.dom.Document 对象,所以我不能把它当作一个字符串)

"<root> <a>trge</a> <b>156</b> </root>"

谢谢!

【问题讨论】:

标签: java xml string dom xmldocument


【解决方案1】:

使用 Apache XMLSerializer

这是一个例子: http://www.informit.com/articles/article.asp?p=31349&seqNum=3&rl=1

你也可以检查一下

http://www.netomatix.com/XmlFileToString.aspx

【讨论】:

  • Xerces 仍然,可笑的是,没有通过 Maven 正式分发(因此也很时髦),包括没有可靠的来源或 JavaDocs,WTF!没有官方的 maven 支持会使弃用解决变得更加困难,使一致更新更加麻烦,并带来安全风险,所以现在对它有任何依赖是愚蠢的!
【解决方案2】:

首先,您需要删除所有文本节点中的所有换行符。然后,您可以使用身份转换来输出您的 DOM 树。查看 TransformerFactory#newTransformer() 的 javadoc。

【讨论】:

    【解决方案3】:

    假设doc 是您的org.w3c.dom.Document 实例:

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer transformer = tf.newTransformer();
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    StringWriter writer = new StringWriter();
    transformer.transform(new DOMSource(doc), new StreamResult(writer));
    String output = writer.getBuffer().toString().replaceAll("\n|\r", "");
    

    【讨论】:

    • 如果您添加另一个输出属性,replaceAll 可能不是必需的:transformer.setOutputProperty(OutputKeys.INDENT, "no");
    • writer.getBuffer().toString() 可以是writer.toString()
    • @bvdb 两个优点。显式添加OutputKeys.INDENT 行还有一个额外的优势,因为您也可以将其设置为"yes" 以保留空格——如果这是您想要的(在我的情况下,我发现只需删除replaceAll无法在字符串中包含空格)。
    • 另请参阅stackoverflow.com/questions/1384802/…,了解如何让缩进正常工作
    猜你喜欢
    • 1970-01-01
    • 2011-02-03
    • 2022-01-15
    • 1970-01-01
    • 2013-03-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多