【发布时间】:2017-03-22 11:57:37
【问题描述】:
我是 Spark 的新手。我通过安装在我们的 HDInsight 集群中的 jupyter notebook 交互式 UI 开发了一个 pyspark 脚本。现在我从 jupyter 本身运行代码,但现在我必须自动化脚本。我尝试使用 Azure Datafactory,但找不到从那里运行 pyspark 脚本的方法。也尝试使用 oozie 但不知道如何使用它。我尝试保存笔记本并重新打开它并运行所有单元格,但它就像手动方式。
请帮我在 Microsoft Azure 中安排一个 pyspark 作业。
【问题讨论】:
标签: azure pyspark cluster-computing jobs azure-hdinsight