数值数据 - 高容量 + 高速 + 快速检索答案

【问题标题】：Numerical Data - High Volume + High Velocity + Fast Retrieval数值数据 - 高容量 + 高速 + 快速检索
【发布时间】：2013-05-03 13:04:50
【问题描述】：

我的数据看起来像每帧 1000 万个数值（实数 + 二进制）（想想数组，即数组的一行中有 1000 万个元素），大约有 100 帧/秒。一种时间序列。

我面临的挑战是：

(1) 存储 - 数据量

(2) 数据的处理速度

(3) 实时分析

Cassandra 适合这个吗？任何人都可以指导我一些应用程序架构（想想 hadoop、cassandra、kafka、storm 等），这将在上述场景中发挥作用（从非常高的角度来看）。

我知道我问了一些大问题。在实验之前我需要一个方向。

【问题讨论】：

标签： hadoop cassandra bigdata analytics apache-storm

【解决方案1】：

作为存储引擎或数据处理速度，Cassandra 和 Hadoop 将一帆风顺。

现在进入实时部分，Cassandra 可以为您提供近乎实时的解决方案，而仅 Hadoop 是不够的（批处理性质、map-reduce 作业）。您可以尝试使用带有 Storm 的 Hadoop，这将为您提供近乎实时的能力，但它会增加解决方案的复杂性（使用 spouts 和 bolts）。还您可以尝试一些规则引擎，这将为您提供实时解决方案的额外优势。

【讨论】：

感谢分享。您能否详细说明一下如何实时集成 Hadoop+Storm？您是否建议有两个独立的部分 - 用于实时的 Storm 和用于批处理的 Hadoop？