【发布时间】:2014-11-12 14:31:09
【问题描述】:
我正在寻找一种解决方案,它可以让我将代码与数据放在一起。 作为 Db,我拥有 Cassandra,并且希望能够获取位于特定节点上的数据。
这里的重要性是我尝试通过自己的代码实现它,而不使用框架,如 Hadoop 或 Spark。
如果有人可以解释或提供链接,我很高兴,因为我还没有找到解决方案。 这里的问题是,如何使用 Cassandra 实现这一点。
提前致谢
【问题讨论】:
-
你为什么要这样做?
-
我想实时处理大数据,我希望将数据保存在内存中,因为有这样的功能。但是我仍然需要分布式计算,因此,数据局部性,来实现实时目标
-
是写重还是读重?
-
阅读量很大(但 Cassandra 是我必须忍受的)
-
我会说让它成为内存表并设置复制,以便它存在于每个节点上。不要诋毁那些试图帮助你的人最喜欢的工具也可能会有所帮助。
标签: cassandra colocation