【发布时间】:2017-09-11 09:48:23
【问题描述】:
我很难理解内存管理如何与 Spark on Yarn 一起工作:
我的spark-submit 有
--executor-memory 48g
--num-executors 2
当我运行top -p <pids_of_2_yarn_containers/executors>
VIRT RES %MEM
51.059g 0.015t ~4 (container 1)
51.039g 0.012t ~3 (container 2)
系统总内存380g。
最后,在 YARN 上,当我单击可以看到的每个容器页面时:
Resource: 54272 Memory (container 1)
Resource: 54272 Memory (container 2)
为什么上述每个指标都没有加起来?我在每个 spark 执行器上请求 48g,但是 YARN 显示 54g,操作系统报告使用了 15gb 物理内存(顶部的 RES 列)和使用了 51g 的虚拟内存(VIRT 列)。
【问题讨论】:
标签: unix apache-spark hadoop-yarn ram virtual-memory