【问题标题】:Move whole file into HDFS as single file using flume spooling directory使用水槽假脱机目录将整个文件作为单个文件移动到 HDFS
【发布时间】:2023-04-08 11:17:01
【问题描述】:

Aa 就水槽文档而言,我们可以根据事件大小或事件计数或持续时间将数据移动到 HDFS。有没有办法将整个文件从假脱机目录移动到 HDFS 作为单个文件

Example 
Spooling Dir             HDFS
file1 - 1000 event ----> file1-1000 event
file2 - 1008 event ----> file2 - 1008 event
file3 - 800 event  ----> file3 - 800 event 

谢谢。

【问题讨论】:

    标签: flume-ng


    【解决方案1】:

    嗯,有点。您需要调整您的配置以反映这一点,因为 Flume 并非旨在推动整个文件而不管其大小,因为您可以更有效地使用 hadoop fs -copyFromLocal 来做到这一点。

    这里列出了您需要配置的内容:

    a) 批处理通道大小必须小于文件中的事件大小,以防您偶尔假脱机文件。否则您的活动可能会停留在您的频道中。

    b) hdfs.rollSize = 0 以确保您的文件在任何大小限制后都不会翻转

    c) hdfs.rollCount = 0 以确保您的文件不会在任何数量的事件后翻转

    d) hdfs.rollInterval 设置为适当的数量,以确保您的文件 git 准时假脱机。

    e) 一次假脱机一个文件以避免混淆。

    基本上就是这样。

    【讨论】:

      猜你喜欢
      • 2015-02-21
      • 1970-01-01
      • 1970-01-01
      • 2016-12-10
      • 1970-01-01
      • 2021-04-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多