【发布时间】:2016-10-28 00:15:23
【问题描述】:
我知道有状态和无状态流式处理之间的区别。我读到 Storm 是无状态的,而 Trident 是有状态的。我还读到 Hadoop(用于批处理)是有状态的,Spark 可以计算有状态的操作。
有人可以澄清这些吗?具体来说,
- spark 能否同时进行有状态和无状态操作?
- Hadoop 是有状态的意味着什么,因为在谈到 Hadoop 时我们只讨论批处理。
- Apache Storm 如何处理有状态流? (使用三叉戟?)
【问题讨论】:
标签: hadoop apache-spark apache-storm