【问题标题】:Azure Data Factory Pricing - Activity CountAzure 数据工厂定价 - 活动计数
【发布时间】:2020-09-17 04:52:54
【问题描述】:

我正在考虑使用数据工厂将数据从 Blob 存储容器复制到 SQL 表,但我不太确定我是否了解定价的工作原理,特别是活动的计数方式。

因此,如果我有一个包含 3 个活动的管道,它从 CSV 复制数据,其中包含 1000 行,那么总活动计数是 3*1 还是 3*1000?换句话说,我会根据它处理的文件数或它复制的总行数来收费吗?

【问题讨论】:

    标签: azure azure-data-factory azure-data-factory-2


    【解决方案1】:

    这是 3 次活动。活动运行以千人为单位,每人 1 美元。由于这些是复制活动,因此它们以每小时 0.25 美元的价格消耗数据集成单元 (DIU)。管道执行时间按每小时 0.005 美元计费。如果您将所有这些都加到 1 个管道和 3 个运行 1 小时的复制活动中,那么您的总费用约为 27 美分。

    我们每个月运行数千个管道,所有这些管道都有许多活动,包括相当多的复制活动。我们的数据工厂账单仍然很低,以至于在我们的 Azure 总支出中看起来像是一个舍入错误。

    数据流是个例外。 Data Flow 是一个 Spark 包装器,因此您必须为集群时间付费,如果您不小心,这可能会很快变得昂贵。

    【讨论】:

    • 感谢您的回答。我有一个执行其他一些“子”管道的管道。每一个都需要不到 1 分钟的时间以每小时 4 个 DIU 的成本运行。 Azure 门户似乎以 0.0067 DIU 小时计算每个。所以,我猜它四舍五入到最近的分钟。你知道我是否会像每次跑步都用满一分钟一样收费?或者实际上如果运行只需要 20 秒,会是这个量的三分之一吗?
    • 我不知道他们是按分钟还是按秒计费,我在文档中找不到答案。
    • 我发现它确实按分钟收费,并且向上取整。所以我的 20 秒过程是按整分钟收费的。但是更大的部分成本来自它对活动的四舍五入,正如你所说,管道持续时间成本可以忽略不计
    【解决方案2】:

    实际上,您必须为 2 个重要指标付费:编排和执行。请参阅此document 的更多详细信息。

    1.Orchestration,每 1,000 次运行 1 美元。你有 3 个活动,那么应该是 $3/1000。

    2.执行,取决于你配置的DIU,也就是你的传输性能。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-06-11
      • 1970-01-01
      • 1970-01-01
      • 2021-12-17
      • 2022-01-04
      • 1970-01-01
      • 1970-01-01
      • 2022-11-11
      相关资源
      最近更新 更多