【问题标题】:AWS Glue Bookmark: run job vs triggerAWS Glue 书签:运行作业与触发器
【发布时间】:2020-09-22 15:51:12
【问题描述】:

我想知道如果我将 Run JobTrigger Runs 交替使用,对于启用了书签的特定 Job,它的逻辑是如何工作的。

示例

我使用运行作业按钮手动运行我的作业并处理特定文件夹中的输入文件。在此输入文件夹中创建新文件。半小时后,作业被预定的触发器触发。

计划的触发器会知道“手动”运行作业处理的文件还是不同的书签过程?

【问题讨论】:

    标签: amazon-web-services apache-spark aws-glue


    【解决方案1】:

    作业书签的检查点相对于 transformation_ctx 进行保存,并且在从脚本运行 job.commit() 命令时提交更新的检查点。

    由于通过触发器或手动运行作业,导致调用相同的 API 操作 (StartJobRun) 并且这些作业运行实际上运行相同的代码,每个新的作业运行都会知道上次运行的书签更新。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-03-27
      • 2021-07-29
      • 2019-05-12
      • 1970-01-01
      • 2021-08-13
      • 2021-07-08
      • 2019-11-05
      • 1970-01-01
      相关资源
      最近更新 更多