1 winsow的概念

flink是流失处理框架,在真实应用中流一般是没有边界的.那要处理无界的流我们一般怎么处理呢?一般是把无界流切分成一份份有界的流,窗口就是切分无界流的一种方式.它会将流数据分发到有限大小的桶(bucket)中进行分析.
三 Flink window API

2 window的类型

2.1 时间窗口(Time Window)

  • 滚动时间窗口
    三 Flink window API
    (1) 将数据依照固定的窗口大小进行切分,每个窗口首尾相连.
    (2) 时间对齐,窗口长度固定,没有重叠

  • 滑动时间窗口
    三 Flink window API
    (1) 滑动窗口是固定窗口的更广义的一种形式,滑动窗口由固定的窗口长度和滑动间隔组成
    (2) 窗口长度固定,可以有重叠

  • 会话窗口
    三 Flink window API
    (1) 由一系列事件组合一个指定时间长度的 timeout 间隙组成,也就是一段时间没有接收到新数据就会生成新的窗口
    (2) 特点:时间无对齐

2.2 计数窗口(Count Window)

  • 滚动计数窗口
    和时间滚动窗口差不多,但时间滚动窗口是按照时间来设置窗口的大小和滚动步长的.计数窗口是按照数据的数量来设置窗口大小.
    比如开一个50条数据的窗口,等数据来了50条之后,窗口就会关闭.

  • 滑动计数窗口
    和时间滑动窗口差不多.

相关文章: