【发布时间】:2012-02-07 06:26:07
【问题描述】:
在 Hadoop 书中,据说我们可以在创建文件时指定每个文件的块大小。
“增加分割大小最自然的方法是在 HDFS 中拥有更大的块,通过设置 dfs.block.size 或在文件构建时基于每个文件。”
知道如何在文件构建时执行此操作。我希望通过将其设置为 value = file-size,文件不会被拆分
【问题讨论】:
-
基本上我有一个流式作业(c++ 代码),我只是使用 -CoprFromLocal 将输入文件复制到 HDFS。此处是否有任何选项可用于指定文件块大小。我认为 HDFS 在创建文件时提供了一个 api 来指定块大小。 FileSystem.create(路径、覆盖、缓冲区大小、复制、块大小、进度)。但可能我不能使用这个。我正在寻找一些 cli 选项。