每个工人使用 YARN 和 Spark 有多个执行者？

【问题标题】：Multiple executors per worker using YARN and Spark?每个工人使用 YARN 和 Spark 有多个执行者？
【发布时间】：2016-10-28 16:05:34
【问题描述】：

在我的公司，我们使用新旧机器的组合拼凑了一个非常异构的 YARN + Spark 集群。由于单个机器的统计数据差异很大，我希望能够在更大的机器上启动多个执行器。将--num-executors 设置为高于集群中的机器数不起作用。是否需要更改其他设置才能启用此功能，还是不可能？

【问题讨论】：

标签： apache-spark hadoop-yarn executors

【解决方案1】：

传递 --executor-cores 选项。这应该是〜4以获得良好的性能： http://www.datarpm.com/resources/achieving-optimal-performance-with-apache-spark1-5/

这将在 4 核机器上启动一个执行器，在 16 核机器上启动 4 个执行器。

【讨论】：

我认为这不是真的。由于内存限制，我将 --executor-cores 设置为 2，但我仍然在所有机器上只有一个执行程序，包括具有 32 个内核的机器。
你能在你的问题中发布你的 spark conf 吗？这将有助于我们调试。

猜你喜欢

2017-01-27
2017-08-27
1970-01-01
2020-05-12
1970-01-01
2023-03-26
2023-04-05
2017-05-12
1970-01-01

相关资源

下载 2023-03-09
下载 2023-01-04
下载 2023-03-22

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode