【问题标题】:Airflow Livy jobs subission on AWS EMRAWS EMR 上的 Airflow Livy 作业订阅
【发布时间】:2020-04-13 09:44:11
【问题描述】:

我们正在使用 Airflow 在 EMR 上安排我们的作业,目前我们想使用 apache Livy 通过 Airflow 提交 Spark 作业 我需要以下更多指导: 我们应该将哪个 Airflow-Livy 运算符用于 python 3+ pyspark 和 scala 作业。 我在下面看到: https://github.com/rssanders3/airflow-spark-operator-pluginhttps://github.com/panovvv/airflow-livy-operators

想了解更多关于稳定的 AirflowLivy 运营商的任何人在生产中使用的可能在 AWS 堆栈中。

还有用于集成的分步安装指南。

【问题讨论】:

    标签: apache-spark pyspark airflow amazon-emr livy


    【解决方案1】:

    我建议使用来自https://github.com/apache/airflow/blob/master/airflow/providers/apache/livy/operators/livy.py的 LivyOperator

    目前,它仅在 Master 中可用,但您可以复制粘贴代码并将其用作自定义运算符,直到我们为 Airflow 1.10.* 系列支持所有新运算符

    【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-05-23
    • 2019-03-20
    • 2019-10-25
    • 2019-09-12
    • 1970-01-01
    • 2014-08-01
    • 1970-01-01
    • 2019-06-11
    相关资源
    最近更新 更多