【发布时间】:2018-04-17 21:03:41
【问题描述】:
我有一个集群,其纱线资源约为 15 TB。我正在尝试通过 Hive 提交查询。我在 yarn 上的默认容器大小为 4GB。为该查询分配的映射器数量约为 1000。我的纱线队列中总共分配了 10% 的资源。因此,在单个时间点只会分配 430 个容器。每个映射器总共分配了 1 个容器。 HDFS 上的块大小为 128 MB。如何优化查询。
【问题讨论】:
标签: hadoop hive containers hadoop-yarn tez