【发布时间】:2015-03-02 23:00:55
【问题描述】:
我知道这个简单的问题,我需要这个社区的这个查询的帮助,当我创建 ORC 格式的 PartitionTable 时,当我尝试从指向 2 GB 文件的非分区表中转储数据时,我有 210 列,我请参阅 Mapper 的数量为 2 和 reducer 的数量为 2 。有没有办法增加 Mapper 和 reducer。我的假设是我们不能像 MR 1.0 那样设置 Mapper 和 reducer 的数量,它基于 Yarn 容器大小、Mapper 最小内存和最大内存等设置。任何人都可以建议我 TEz 计算映射器和化简器。保持内存大小设置的最佳价值是什么,这样我就不会遇到:Java 堆空间、Java 内存不足问题。我的文件大小可能会增长到 100GB。请帮我解决这个问题。
【问题讨论】:
标签: mapreduce hive hadoop-yarn hiveql azure-hdinsight