【问题标题】:How to load python libraries in Azure Data Factory Custom Activity?如何在 Azure 数据工厂自定义活动中加载 python 库?
【发布时间】:2018-11-08 01:13:11
【问题描述】:

我知道您可以使用带有预加载 python 库的自定义 VM 映像的批量自定义活动来通过 ADF 运行您的 python 程序。

我们还可以使用普通的 linux VM 映像并加载 python 库作为执行自定义活动的一部分吗?我知道这可能会增加执行时间,因为每次都必须安装库,但我想知道它是如何完成的。解释/示例表示赞赏。

谢谢!

【问题讨论】:

    标签: python azure azure-data-factory azure-batch custom-activity


    【解决方案1】:

    您可以使用 Azure Batch start task 高效地安装预定义库。通过自定义活动针对同一池提交的所有作业都可以访问它们。

    或者,您可以通过对 Linux 池节点执行 shell 脚本来安装依赖库,该脚本将设置库,然后触发 python 代码。

    【讨论】:

    • 谢谢,听起来很完美。启动任务似乎只接受一个命令,所以如果我有多个库,我可能还需要在那里编写 shell 脚本?
    • 这是正确的。有一个安装所有体面的主脚本。您可以在建议的启动任务中执行此操作,甚至可以在自定义活动执行期间通过执行 shell 脚本来执行此操作,该脚本可以调用所需的 python 代码(确保所有资源 - 主 bash 脚本 + Python 文件 + 任何其他资源依赖项都是在自定义活动的文件夹路径属性中提供。自定义活动只需将它们复制到批处理节点上)
    猜你喜欢
    • 1970-01-01
    • 2018-08-02
    • 2018-10-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-05-12
    • 2020-09-17
    • 2020-07-02
    相关资源
    最近更新 更多