【发布时间】:2019-06-17 05:41:11
【问题描述】:
所以我在我的 Hadoop 集群上使用 WordCount 运行了 50 MB 的数据。我在 5 个不同的集群大小、单节点集群到 5 个节点集群上运行测试。问题是,执行时间变化不大。每次运行只有 1 - 2 分钟不同。向集群中添加节点不是可以使用更多资源并使作业运行得更快吗?
我希望添加每个节点后执行时间会更快,但结果显示我不是这样。
我使用的节点有 2 GB 的 RAM 和 2 个内核。 我不会更改有关 yarn-site.xml 上的容器和 mapred-site.xml 上的 map/reduce allocation.mb 的任何内容。
【问题讨论】: