【发布时间】:2018-02-22 17:25:12
【问题描述】:
是否可以将 DataFrame 用作 Spark Streaming 的 State / StateSpec?当前的 StateSpec 实现似乎只允许键值对数据结构(mapWithState 等)。
我的目标是保持一个固定大小的 FIFO 缓冲区作为 StateSpec,每次新数据流入时都会更新。我想在 Spark DataFrame API 中实现缓冲区,以与 Spark ML 兼容。
【问题讨论】:
标签: apache-spark spark-dataframe spark-streaming