【发布时间】:2017-05-08 05:10:54
【问题描述】:
我想知道在 hadoop 环境中是否有任何工具可以用来解析 XML 文件。我知道使用 map reduce 如果没有可用的工具,我们可以解析 XML 文件,而不是在哪种语言 scala、java 或 pig 中解析更好? 请帮忙。
【问题讨论】:
标签: xml scala hadoop apache-pig bigdata
我想知道在 hadoop 环境中是否有任何工具可以用来解析 XML 文件。我知道使用 map reduce 如果没有可用的工具,我们可以解析 XML 文件,而不是在哪种语言 scala、java 或 pig 中解析更好? 请帮忙。
【问题讨论】:
标签: xml scala hadoop apache-pig bigdata
hadoop 环境通常具有可用的 Java。所以我会使用“Java Architecture for XML Binding”或 JAXB。
它相对容易使用,并且有包含主要方法的开发策略:
它有很多功能,但除非你需要它们,否则不要担心添加所有的花里胡哨。它也相当快。
You can find the learning path for it here.
Scala 也是一个很好的选择,但它的学习曲线有点高(如果您已经了解 Java 并且接触过基于 Lambda 的语言,那么学习曲线不会那么高)。文档是合理的,但有时它只是缺少可用于 Java 的文档。
对于没有使用 Scala 交付记录的团队,Scala 将是我的第二选择。这并不难,而且对于某些问题,Scala 要容易得多,但是如果没有一点 Scala 经验,人们往往会利用非 Scala 方法来解决 Scala 中的问题。
Pig 是一种我经验有限的语言,所以我将保留评论。
【讨论】: