大数据之Storm - 爱码网

Storm

为hadoop提供流处理，运维简单，高度容错，支持多种语言的实时数据处理系统。

Storm集群主要由一个主节点和一群工作节点组成，通过Zookeeper集群协调。

集群架构：

大数据之Storm

大数据之Storm

在storm中，应用程序实现实时处理的逻辑被封装进Storm中的topology中，一个topplpgy是一组Spout组建和Bolt组件通过Stream Gruoping进行连接的图。

大数据之Storm

2.字段分组（Fields grouping）：根据指定字段分割数据流，并分组。例如，根据“userid”字段，相同“user-id”的元组总是分发到同一个任务，不同“user-id”的元组可能分发到不同的任务。

大数据之Storm

3.全部分组（ALL grouping）：tuple被复制到bolt的所有任务。这种类型需要谨慎使用。

大数据之Storm

4. 全局分组（Global grouping）：全部流都分配到bolt的同一个任务。明确地说，是分配给ID最小的那个task。
5. 无分组（None grouping）
6. 直接分组（Direct grouping）

大数据之Storm