【问题标题】:Hadoop - producing multi column ouptut (MongoDB)Hadoop - 产生多列输出(MongoDB)
【发布时间】:2013-06-10 12:37:08
【问题描述】:

我正在使用 Hadoop 在我的 MongoDB 数据库中应用 map reduce。 我可以在this link 中执行示例。

现在我只能在执行 map reduce 作业后在输出集合中获取键、值对。我想知道是否可以在 map reduce 输出集合中保存多个列? 还是值列中的嵌入文档?

谢谢。

【问题讨论】:

    标签: mongodb hadoop mapreduce


    【解决方案1】:

    是的 - 使用 BSONWritable 作为您的 reducer 输出类,并创建一个 BSONWritable 对象,其中包含您需要的尽可能多的列。

    参见此处的示例:

    https://github.com/mongodb/mongo-hadoop/blob/master/examples/treasury_yield/src/main/java/com/mongodb/hadoop/examples/treasury/TreasuryYieldReducer.java

    【讨论】:

    • 感谢提示..我可以得到多列输出..使用hadoop在mongodb中应用map reduce时是否可以输出嵌入式文档?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-08-05
    • 1970-01-01
    • 1970-01-01
    • 2020-04-25
    • 1970-01-01
    • 2021-10-01
    • 1970-01-01
    相关资源
    最近更新 更多