【发布时间】:2016-06-22 04:31:37
【问题描述】:
我之前使用过storm,我需要更多的批处理功能,所以我在storm中搜索了批处理。 我发现了实时进行微批处理的 Trident。
但不知何故,我无法弄清楚 Trident 如何处理微批处理(流量、批处理大小、批处理间隔)以知道它确实有我需要的东西。
我想做的是收集/保存喷口在一段时间内发出的元组,并在另一个时间间隔内将它们重新发送到下游组件/螺栓/功能。 (例如,spout 每秒发出一个元组,下一个 trident 函数将收集/保存元组并每分钟发出 50 个元组到下一个函数。)
有人可以指导我在这种情况下如何应用 Trident 吗? 或者任何其他使用风暴功能的适用方式?
【问题讨论】:
标签: tuples apache-storm trident batching