【问题标题】:Scheduling an EMR Cluster调度 EMR 集群
【发布时间】:2014-03-21 16:59:42
【问题描述】:

我已经使用 HIVE 和 PIG 构建并存储了查询,我想安排每周运行一次。这些脚本创建 S3 文件并更新 DynamoTables。我可以使用什么来创建 AmazonEMR 集群以按计划自动运行这些脚本。

我在考虑 AWS Data Pipeline,但它似乎需要创建数据节点,我认为这对于我的目的来说是不必要的。

【问题讨论】:

    标签: amazon-web-services hive amazon-emr amazon-data-pipeline


    【解决方案1】:

    如果在 HiveActivity 上禁用暂存,则无需指定数据节点。

    阶段 = 假

    请参阅the example in this post

    【讨论】:

      猜你喜欢
      • 2018-06-20
      • 1970-01-01
      • 2016-08-02
      • 2020-10-14
      • 1970-01-01
      • 1970-01-01
      • 2017-07-17
      • 2016-02-19
      • 1970-01-01
      相关资源
      最近更新 更多