【发布时间】:2018-05-22 13:21:42
【问题描述】:
假设我们有一个 RDD,它被多次使用。所以为了一次又一次地保存计算,我们使用 rdd.persist() 方法持久化了这个 RDD。
所以当我们持久化这个 RDD 时,计算 RDD 的节点将存储它们的分区。
那么现在假设,包含这个 RDD 持久化分区的节点失败了,那么会发生什么? spark如何恢复丢失的数据?有没有复制机制?还是其他机制?
【问题讨论】:
-
同样的故障 Torrance 只在这里工作
标签: apache-spark spark-streaming rdd failover