【问题标题】:what are the guidelines to improve flume performance提高水槽性能的指导方针是什么
【发布时间】:2016-06-22 10:02:27
【问题描述】:

我有一个用例,我必须在 HDFS 中传输一百万个或更多文件。文件大小可以从 10kb 到 50kb 不等。

  • 我正在使用假脱机目录源和 HDFS 接收器和文件通道。
  • 我也在使用 BLOB 反序列化器,因为我不想破坏我的源数据。它应该将传输完整文件作为我能够实现的事件。 到目前为止,我的水槽代理设计看起来像这样 - my flume agent design

    我仍然无法获得良好的表现。

    我也想了解一下hadoop集群配置是否有助于提高性能?

  • 【问题讨论】:

      标签: apache hadoop flume hortonworks-data-platform bigdata


      【解决方案1】:

      AFAIK,性能调整没有灵丹妙药。像往常一样,您需要根据您的数据和基础设施进行实验和学习。以下文章讨论了可用于微调 Flume 性能的各种旋钮(和一般指导): Cloudera - Flume Performance Tuning, DZone - Flume Performance Tuning

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2015-01-24
        • 2014-07-20
        • 1970-01-01
        • 2010-09-09
        • 2013-07-24
        • 2012-09-13
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多