【发布时间】:2016-07-20 21:53:02
【问题描述】:
我在 hive 中使用 getLastProcessedVal2 UDF 从表中获取最新的分区。此 UDF 是用 java 编写的。我想使用来自 pyspark 的相同 UDF 使用 hive 上下文。
dfsql_sel_nxt_batch_id_ini=sqlContext.sql(''' select l4_xxxx_seee.**getLastProcessedVal2**("/data/l4/work/hive/l4__stge/proctl_stg","APP_AMLMKTE_L1","L1_AMLMKT_MDWE","TRE_EXTION","2.1")''')
错误:
错误 exec.FunctionRegistry:无法加载 UDF 类: java.lang.ClassNotFoundException:
【问题讨论】:
标签: hadoop apache-spark pyspark apache-spark-sql