【发布时间】:2023-04-04 14:36:01
【问题描述】:
在筛选一些 Hadoop 指南时,我找不到问题的答案:我通过客户端计算机上的 shell 脚本一次性提交各种 Hadoop 作业(最多 200 个)。每个作业都通过一个 JAR(相当大;大约 150 MB)启动。提交作业后,客户端计算机的 CPU 负载非常高(每个内核都在 100% 上),并且 RAM 很快就满了。这样,客户端不再可用。我以为每个作业的计算完全在Hadoop框架内完成,作业运行时集群和客户端之间只交换一些状态信息。
那么,为什么客户端会完全拉伸?我是否以错误的方式提交 Hadoop 作业?每个 JAR 是否太大?
提前致谢。
【问题讨论】:
标签: client hadoop jobs cpu-usage