目前而言SparkStreaming 主要支持以下三种业务场景:

  ➢ 无状态操作只关注当前的DStream中的实时数据。例如:只对当前DStream中的数据做正确性校验。(下一条与上一条数据无关)      适合做预警系统

  ➢ 有状态操作:对有状态的DStream进行操作时,需要依赖之前的数据。例如:统计网站各个模块总的访问量。                 累加累乘汇总 

  ➢ 窗口操作:对指定时间段范围内的DStream数据进行操作。例如:需要统计一天之内网站各个模块的访问数量。                热点

 

初识流计算      

查看此例子,对流计算直观认识
  ◆ 启动服务
  ◆ nc -lk 9999
  ◆ run-example streaming.NetworkWordCount localhost 9999

nc  netcat  网络工具命令

相关文章:

  • 2022-12-23
  • 2021-08-07
  • 2021-12-31
  • 2021-11-26
  • 2022-01-01
  • 2021-05-23
  • 2021-07-12
  • 2021-11-20
猜你喜欢
  • 2021-12-31
  • 2021-12-02
  • 2021-12-31
  • 2022-01-17
  • 2022-02-03
相关资源
相似解决方案