【发布时间】:2017-07-29 06:24:06
【问题描述】:
我想使用 Python UDF 转换配置单元表(hdfs 现场实例),为此我需要一个外部库“用户代理”。我不使用外部库的 udf 工作正常。但是当我想使用它时,我无法让它工作。
我尝试使用下面给出的代码安装库。
import sys
import subprocess
import pip
import os
sys.stdout = open(os.devnull, 'w+')
pip.main(['install', '--user', 'pyyaml'])
pip.main(['install', '--user', 'ua-parser'])
pip.main(['install', '--user', 'user-agents'])
sys.stdout = sys.__stdout__
然后我尝试了这个
import user_agents
但 udf 因“未找到模块”异常而崩溃。我还尝试通过代码检查以下路径:
/usr/local/lib/python2.7/site-packages
/usr/local/lib64/python2.7/site-packages
但是那里没有 user_agents 模块。有关如何使事情正常进行的任何帮助?真的很感激。谢谢!
【问题讨论】:
标签: python hadoop hive user-defined-functions hiveql