消息队列－Metaq(RocketMQ)原理

适用于大存储量，顺序消息，广播和日志数据传输的场景。设计理念类似kafka，场景类似。和kafak的一些差异如下，可以考虑差异使用：

因为metaq主要实现和kafka原理相似，产品特性可以参考kafak，这里主要列出两个产品的差异点：

功能	特性	Kafka	Metaq	备注
数据可靠性	刷盘和复制	异步刷盘同步异步复制	同同步异步复制步异步刷屏
性能对比	写入速度	100w/s	7w/s	Kafka合并小数据批量发送
单机队列数	队列或分区数	5w/分区或队列	64/分区或队列
实时性	消息投递	Kafka使用短轮询方式，实时性取决于轮询间隔时间。0.8版本以上已经支持长轮询	使用长轮询，同Push方式实时性一致
消费失败重试		支持固定时间重试，需要配置	支持定时重试，每次重试间隔时间顺延
定时／延时消息		不支持	支持
分布式事务		不支持	支持
消息查询		不支持	支持根据Message Id查询消息，也支持根据消息内容查询消息（发送消息时指定一个Message Key，任意字符串，例如指定为订单Id
消息回溯		Offset回溯	支持按照时间来回溯消息，精度毫秒
消费并行度		依赖与分区数	顺序模式：依赖分区数乱序模式：取决与conusmer的线程数
消息轨迹		不支持	支持
Broker端消息过滤		不支持	基于tags过滤支持上传代码过滤
消息堆积能力		更强	强	理论上都够用

消息持久存储
metaq 将消息存储在本地文件中,每个文件最大大小为 1G,如果写入新的消息时,超过当前文件大小,则会自动新建一个文件。文件名称为起始字节大小。
即使一个 broker 为多个 topic 服务,这些 topic 的消息都存储同一个文件组中,消息顺序写入,永远都是当前文件在写,其他文件只读
broker 将消息存储到文件后,会将该消息在文件的物理位置,消息大小,消息类型封装成一个固定大小的数据结构,暂且称这个数据结构为索引单元吧,大小固定为 16k,消息在物理文件的位置称为 offset。
多个索引单元组成了一个索引文件,索引文件默认固定大小为 20M,和消息文件一样,文件名是起始字节位置,写满后,产生一个新的文件。
由于meta把kafka中一个partion一个文件夹的思路，转变成了多个partition共享一个文件，实现真正的顺序写。所以可以支持更多的topic和partition。

处理数据流程：
- 根据 topic 和 partition 找到逻辑队列:A  
- 根据 offset 从 A 定位指定的索引文件:B  
- 从 B 中读取所有的索引数据:C  
- 遍历 C,根据索引单元的消息物理地址和消息长度,找到物理消息 D,将 D 放入集合,并计  算消息的累加长度,若大于请求里消息最大长度 maxSize,则终止遍历,返回结果。  
生产者的数据直接写入磁盘。（有可能在os的缓存中）。通过同步策略刷新进磁盘。

ids
- /meta/brokers/ids/m1/master
- /meta/brokers/ids/m1/slaves1
- /meta/brokers/ids/m1/slaves2 
topics
- meta/brokers/topics/hello/m1-m
- /meta/brokers/topics/hello/m2-m
- /meta/brokers/topics/hello/s1-s
- /meta/brokers/topics/hello/s2-s
partion数据存储在节点的数据中
分组信息存储
- /meta/consumers/hellogroup/ids/hellogroup_c1 节点数据为“hello1,hello2”
- /meta/consumers/hellogroup/ids/hellogroup_c2 节点数据为"hello2,hello3"
分组消费的位置存储
- /meta/consumers/hellogroup/offsets/t1/b1-1数据为 1 。
- /meta/consumers/hellogroup/offsets/t1/b1-2数据为 2 。
- /meta/consumers/hellogroup/offsets/t1/b2-1数据为 3 。
- /meta/consumers/hellogroup/offsets/t1/b2-2数据为 4 。

group 和 topic 是变量,以实际值为准。t,b分别为topic，broker，数字为位置。

Kafka单机写入TPS约在百万条/秒，消息大小10个字节。RocketMQ单机写入TPS单实例约7万条/秒，单机部署3个Broker，可以跑到最高12万条/秒，消息大小10个字节。Kafka的TPS跑到单机百万，主要是由于Producer端将多个小消息合并，批量发向Broker。

Metaq为什么没有进行合并发送：

Topic数的增加对RocketMQ无影响，长时间运行服务非常稳定。Kafka单机超过64个队列/分区，Load会发生明显的飙高现象，队列越多，load越高，发送消息响应时间变长。RocketMQ单机支持最高5万个队列，Load不会发生明显变化。

阿里云招聘，欢迎技术大牛加入：[email protected]