【发布时间】:2020-04-13 09:44:11
【问题描述】:
我们正在使用 Airflow 在 EMR 上安排我们的作业,目前我们想使用 apache Livy 通过 Airflow 提交 Spark 作业 我需要以下更多指导: 我们应该将哪个 Airflow-Livy 运算符用于 python 3+ pyspark 和 scala 作业。 我在下面看到: https://github.com/rssanders3/airflow-spark-operator-plugin 和 https://github.com/panovvv/airflow-livy-operators
想了解更多关于稳定的 AirflowLivy 运营商的任何人在生产中使用的可能在 AWS 堆栈中。
还有用于集成的分步安装指南。
【问题讨论】:
标签: apache-spark pyspark airflow amazon-emr livy