【发布时间】:2011-04-11 16:54:19
【问题描述】:
这个问题有点相关 Fastest XML parser for small, simple documents in Java 但还有更多细节。
我正在开发一个需要解析许多(数以千万计)小型(大约 300k)xml 文档的应用程序。当前的实现使用 xerces-j,在 1.5 GHz 机器上每个 xml 文档大约需要 2.5 ms。我想改进这个性能。我偶然发现了这篇文章
http://www.xml.com/pub/a/2007/05/16/xml-parser-benchmarks-part-2.html
声称 libxml2 的解析速度比任何 java 解析器都要快一个数量级。我不确定我是否相信,但它引起了我的注意。 有人试过使用 jvm 中的 libxml2 吗?如果是这样,它是否比 java dom 解析(xerces)更快? 我想我仍然需要我的 java dom 结构,但我猜从 c 结构的 dom 复制到 java-dom 应该用不了多久。我必须有 java-dom - 在这种情况下 sax 对我没有帮助。
更新:我刚刚为 libxml2 编写了一个测试,它并没有比 xerces 快...因为我的 c 编码能力非常生疏。
更新我在这里稍微扩大了这个问题: why is sax parsing faster than dom parsing ? and how does stax work? 并对放弃 dom 的可能性持开放态度。
谢谢
【问题讨论】:
标签: java xml dom libxml2 xerces