【问题标题】:Azure: Run a data factory activity when a new file is added to data lake storeAzure:将新文件添加到数据湖存储时运行数据工厂活动
【发布时间】:2018-06-06 06:18:38
【问题描述】:

我在 Azure 数据湖存储中有一个大型数据集,每天可能会在那里添加/更新一些文件。如何处理这些新文件而不每次都读取整个数据集? 我需要使用 Data Factory V1 将这些新文件复制到 SQL 服务器。

【问题讨论】:

    标签: azure azure-storage azure-data-factory


    【解决方案1】:

    如果您可以使用 ADF V2,那么您可以使用获取元数据活动来获取每个文件的 lastModifiedDate 属性,然后只复制新文件。你可以参考这个文档。 https://docs.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity

    【讨论】:

    • 就是这样,我需要在V1上找到解决方案,直到我们可以在我们的项目中使用V2。
    猜你喜欢
    • 2017-12-02
    • 1970-01-01
    • 2021-06-22
    • 2022-06-30
    • 2021-10-21
    • 1970-01-01
    • 1970-01-01
    • 2020-07-06
    • 2021-11-25
    相关资源
    最近更新 更多