hue是一个Apache Hadoop ui系统,本篇文章介绍如何使用hue创建一个ozzie的pyspark action的workflow, 该workflow仅包含一个spark action。注意,本文使用的是python语言的pyspark。

  1. 编写一个python操作spark的程序。
    demo.py
from pyspark.sql import SparkSession

spark = SparkSession.builder.enableHiveSupport().appName(
"demo").getOrCreate()

# spark 的一些操作
.......

  1. 新建workflow
    使用hue创建ozzie的pyspark action workflow
    使用hue创建ozzie的pyspark action workflow

传入需要运行的python脚本
使用hue创建ozzie的pyspark action workflow

  1. 对该action 进行一些属性的配置。
    使用hue创建ozzie的pyspark action workflow

对spark进行设置,可以选择spark的运行模式。
默认使用的是spark1 的库去执行,如果使用的是spark2,则需要设置属性oozie.action.sharelib.for.spark=spark2 如图所示。
使用hue创建ozzie的pyspark action workflow
进入2设置,进行一些变量的设置
oozie.libpath 需要使用到spark的一些jar包,填入路径jar包路径。

使用hue创建ozzie的pyspark action workflow
4. 该workflow已经设置成功,可以对其进行运行进行测试。

相关文章:

  • 2022-12-23
  • 2022-02-12
  • 2021-12-01
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-11-20
  • 2021-10-16
猜你喜欢
  • 2022-12-23
  • 2021-06-10
  • 2021-07-05
  • 2021-11-07
  • 2021-11-15
  • 2022-12-23
  • 2021-09-22
相关资源
相似解决方案