【发布时间】:2020-05-28 10:13:50
【问题描述】:
我想让 hive Python UDF 除了来自列的数据外还采用常量参数。
如何做到这一点?
在下面的例子中,我希望下面的 hive 查询能够接受参数'10000',并且 my_udf 应该能够解析这个参数'10000'
# hive>
ADD FILE my_udf.py;
SELECT TRANSFORM(col1, col2, '10000') USING 'python my_udf.py' AS (udf_output) FROM my_table;
和
# my_udf.py
import sys
for line_str in sys.stdin:
line = line_str.strip().split('\t')
print(line[2]) # udf outputs the constant argument we inputted: 10000
【问题讨论】:
标签: python hive user-defined-functions