【发布时间】:2023-03-26 00:57:02
【问题描述】:
我正在学习 Spark,但如果我必须在 Hadoop/Yarn 或 Mesos 上运行 Spark,我会感到困惑。
如果我在 Hadoop/Mesos 上运行,是否有任何性能提升?
现在,我只是在一个 4 节点集群上独立运行。
有经验的用户可以在这里提供一些指导吗?
【问题讨论】:
标签: hadoop apache-spark hadoop-yarn mesos
我正在学习 Spark,但如果我必须在 Hadoop/Yarn 或 Mesos 上运行 Spark,我会感到困惑。
如果我在 Hadoop/Mesos 上运行,是否有任何性能提升?
现在,我只是在一个 4 节点集群上独立运行。
有经验的用户可以在这里提供一些指导吗?
【问题讨论】:
标签: hadoop apache-spark hadoop-yarn mesos
根据您的用例的详细信息,您可能会看到任何给定配置的性能与另一个配置相比有起有落。然而 Hadoop 和 Mesos 为您提供了性能以外的其他优势。每种情况都有很多,但例如:
Hadoop
Mesos - Mesos 比 Hadoop 更专注于特定角色,即跨机器集群管理资源。但是,它在一系列工作负载类型中执行此操作。这些可能是数据处理作业,例如 Spark、Akka 中的分布式应用程序、分布式数据库等。如果一台机器出现故障,它可以将任务转移到其他机器上。
我推荐观看这个视频,我很幸运能够现场参加这次聚会: https://www.youtube.com/watch?v=gzx4-6RB7Yw
它演示了使用 Spark、HDFS、Mesos 和 Docker 在 Amazon 云机器集群上进行分布式计算。
【讨论】: