【发布时间】:2019-05-25 09:08:05
【问题描述】:
我想创建一个可以支持大约 10,000 种不同类型工作的分布式系统。一台机器只能承载 500 个这样的作业,因为每个作业都需要将一些数据预加载到内存中,而这些数据不能保存在缓存中。每个作业都必须有冗余以确保可用性。
我曾探索过 Zookeeper、hadoop 等开源库,但没有一个能解决我的问题。 我能想到的最简单的解决方案是使用托管机器维护作业类型的地图。但是,我如何支持在我的车队上动态分配作业类型呢?如何处理机器故障,以确保每种作业类型在任何时间点都必须在至少 1 台机器上可用。
【问题讨论】:
-
作业是预定义的吗?还是动态来的?
-
作业将被预定义。
-
它是不是批处理系统?
-
不,它是一个实时系统。
-
我的意思是,你收到用户的一些请求了吗?并根据您在其中一台机器上开始工作的请求,对吗?
标签: distributed-computing distributed-system