【发布时间】:2019-10-02 13:13:53
【问题描述】:
我开始使用 Livy,在我的设置中,Livy 服务器在 Unix 机器上运行,我能够对其进行 curl 并执行该作业。我创建了一个胖 jar 并将其上传到 hdfs,我只是从 Livy 调用它的主要方法。我的 Livy 的 Json 有效负载如下所示:
{
"file" : "hdfs:///user/data/restcheck/spark_job_2.11-3.0.0-RC1-
SNAPSHOT.jar",
"proxyUser" : "test_user",
"className" : "com.local.test.spark.pipeline.path.LivyTest",
"files" : ["hdfs:///user/data/restcheck/hivesite.xml","hdfs:///user/data/restcheck/log4j.properties"],
"driverMemory" : "5G",
"executorMemory" : "10G",
"executorCores" : 5,
"numExecutors" : 10,
"queue" : "user.queue",
"name" : "LivySampleTest2",
"conf" : {"spark.master" : "yarn","spark.executor.extraClassPath" :
"/etc/hbase/conf/","spark.executor.extraJavaOptions" : "-Dlog4j.configuration=file:log4j.properties","spark.driver.extraJavaOptions" : "-Dlog4j.configuration=file:log4j.properties","spark.ui.port" : 4100,"spark.port.maxRetries" : 100,"JAVA_HOME" : "/usr/java/jdk1.8.0_60","HADOOP_CONF_DIR" :
"/etc/hadoop/conf:/etc/hive/conf:/etc/hbase/conf","HIVE_CONF_DIR" :
"/etc/hive/conf"}
}
下面是我对它的 curl 调用:
curl -X POST --negotiate -u:"test_user" --data @/user/data/Livy/SampleFile.json -H "Content-Type: application/json" https://livyhost:8998/batches
我正在尝试将此转换为 REST API 调用并遵循 WordCount example provided by Cloudera,但无法将我的 curl 调用转换为 REST API。我已经在 HDFS 中添加了所有 jar,所以我认为我不需要进行上传 jar 调用。
【问题讨论】:
-
分享你遇到了什么异常?
标签: scala apache-spark livy