【问题标题】:Hadoop streaming maximum line lengthHadoop流最大行长
【发布时间】:2010-06-25 12:17:52
【问题描述】:

我正在为 Amazon Elastic Map Reduce 开发 Hadoop 流式工作流,它涉及序列化一些二进制对象并将它们流式传输到 Hadoop。 Hadoop 是否有流输入的最大行长?

我开始只是用越来越大的线条进行测试,但我想我会先在这里问。

【问题讨论】:

  • 什么是“亚马逊电子病历”?除此之外,我不知道行长有任何限制。
  • AMZN EMR == Amazon Elastic Map Reduce,一种按需 Hadoop 服务。我会编辑帖子。谢谢!

标签: streaming hadoop amazon-emr


【解决方案1】:

似乎对行长没有强加限制。自从提出这个问题以来,我一直在编写序列化二进制对象的代码,将它们编码为 base64,然后将它们放入流中进行处理。结果,有些行很长。 Hadoop 无怨无悔地咀嚼着。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-08-23
    • 2017-04-23
    • 2023-03-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多