【发布时间】:2016-05-24 00:09:06
【问题描述】:
我正在使用 Mesos 的 16 CPU 的 64 GB RAM 主机上运行 Spark Streaming 进程。
当我使用 Mesos 作为集群管理器运行它时(通过设置 --master mesos://leader.mesos:5050),它的运行速度比在本地模式下运行时慢得多(--master local[4])。
我找不到原因,我也不知道。我注意到的一件事是,有一项特定任务在 Mesos 上比在 Local 上花费的时间要多得多。
奇怪的是(也许这应该是问题的标题)是任务本身需要 6 秒,而它的阶段(它只有一个阶段)需要不到一秒。见附图(Mesos (1) 和 (2))。怎么会?一份工作不等于各部分之和吗?
金币:
另一个注意事项:我确实设法在另一个 Mesos 集群上运行了完全相同的 Spark Streaming 进程,并且它在合理的时间内运行,与上面描述的本地模式非常相似。我能想到的唯一区别是这个集群有多个主机,并且 Spark 运行的是 2 个执行程序而不是 1 个。(我找不到在 Mesos 上的同一主机上运行超过 1 个执行程序的方法)。可能是这个原因吗?
任何线索将不胜感激。
【问题讨论】:
标签: apache-spark spark-streaming mesos