【发布时间】:2016-01-06 13:19:39
【问题描述】:
我是 Storm 的新手,在弄清楚如何按顺序处理记录时遇到了问题。
我有一个数据集,其中包含具有以下字段的记录:
user_id、location_id、time_of_checking
现在,我想识别已完成我指定路径的用户(例如,从位置 A 到位置 B 再到位置 C 的用户)。
我正在使用 Kafka 生产者并从文件中读取这些记录来模拟实时数据。数据按日期排序。
所以,要检查我的模式是否满足,我需要按顺序处理记录。问题是,由于并行化(螺栓复制),我没有按顺序签入用户。因为这种模式行不通。
如何克服这个问题?如何按顺序处理记录?
【问题讨论】: