【问题标题】:How to convert hadoop sequence file to json format?如何将hadoop序列文件转换为json格式?
【发布时间】:2015-02-04 01:08:44
【问题描述】:

顾名思义,我正在寻找将现有数据从 hadoop 序列文件转换为 json 格式的工具。 我最初的谷歌搜索只显示了与 jaql 相关的结果,我正在拼命努力工作。

是否有任何来自 Apache 的工具可用于此目的?

注意: 我在本地机器上有一个 hadoop 序列文件,想获取相应 json 格式的数据。

所以实际上,我正在寻找一些工具/实用程序,它将 hadoop 序列文件作为输入并以 json 格式生成输出。

谢谢

【问题讨论】:

    标签: hadoop hdfs


    【解决方案1】:

    Apache Hadoop 可能是读取序列文件的好工具。

    除了开玩笑,为什么不编写最简单的 Mapper Java 程序,例如,使用 Jackson 序列化它看到的每个键和值对呢?那将是一个非常容易编写的程序。

    【讨论】:

      【解决方案2】:

      鉴于其如此普遍的要求,我认为必须有一些工具可以做到这一点。是的,它应该很容易编码,但是如果你已经有一些相同的东西,为什么要这样做。 无论如何,我想办法用 jaql 来做。对我有用的示例工作查询,

      read({type: 'hdfs', location: 'some_hdfs_file', inoptions: {converter: 'com.ibm.jaql.io.hadoop.converter.FromJsonTextConverter'}});

      【讨论】:

        猜你喜欢
        • 2023-04-09
        • 1970-01-01
        • 2017-10-10
        • 1970-01-01
        • 2019-12-10
        • 2021-10-15
        • 1970-01-01
        • 2021-12-11
        • 2015-12-17
        相关资源
        最近更新 更多