【问题标题】:Shutdown spark structured streaming gracefully优雅地关闭火花结构化流
【发布时间】:2018-07-12 01:05:41
【问题描述】:

有一种方法可以通过将属性 spark.streaming.stopGracefullyOnShutdown 设置为 true,然后使用 kill -SIGTERM 命令终止进程来启用 Spark 流的正常关闭。但是,我看不到结构化流(SQLContext.scala)可用的此类选项。

结构化流的关闭过程是否不同?还是根本没有实施?

【问题讨论】:

  • 我们最近有一个类似的case 并通过使用文件系统优雅地停止流式作业来解决它

标签: apache-spark apache-spark-sql spark-streaming spark-structured-streaming


【解决方案1】:

此功能尚未实现。但 spark 结构化蒸汽的预写日志声称可以毫无问题地恢复状态和偏移量。

【讨论】:

  • 所以基本上你的意思是,如果我使用 kill 命令关闭通过 spark-submit 命令启动的 Spark Structured Streaming 应用程序,尽管没有“正常关闭”,但不会丢失任何数据?
  • @AnderMurilloZohn 是的
【解决方案2】:

此功能尚未实现,如果您在批处理运行时从资源管理器中终止作业,它也会给您重复。

【讨论】:

  • 根据另一个答案,由于预写日志功能不应该出现问题。您是否尝试从命令行终止该进程?它也会产生重复吗?
  • 取决于您对问题的定义。从技术上讲,重复不被视为问题,因为无论如何您都有至少一次交付保证,并且重复不会违反该保证,即无论如何您都应该期待重复。
【解决方案3】:
猜你喜欢
  • 2021-05-31
  • 1970-01-01
  • 2020-02-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-08-18
  • 2019-06-08
  • 2018-06-06
相关资源
最近更新 更多