该文章只针对MAC版,kettle版本对应的是7.1,CDH为5.11.2


连接 hive2 三部曲


  1. 启动hiveServer2
  2. 修改plugin.properties及添加覆盖xml文件
  3. 添加hive对应的jar包

1.cdh安装完后hiveServer2可以直接在UI界面启动.

(也可以控制台shell命令启动)


2.修改plugin.properties及添加覆盖xml文件

2.1 修改plugin.properties文件

plugin.properties文件地址在
kettle⁩/⁨data-integration⁩/plugins⁩/pentaho-big-data-plugin⁩目录下

plugin.properties需要修改的内容是(注意这里只针对CDH):
active.hadoop.configuration=cdh510

有同学可能问为什么是cdh510?我们需要去
kettle⁩/⁨data-integration⁩/plugins⁩/pentaho-big-data-plugin⁩/hadoop-configurations
中查看
笨鸟的平凡之路-kettle使用之hive2连接之前的配置
修改完plugin.properties文件保存.

2.2 添加覆盖xml文件

然后我们进入图例的cdh510目录中,首先需要将xml文件替换成CDH集群的xml文件
笨鸟的平凡之路-kettle使用之hive2连接之前的配置
替换完之后图示:
笨鸟的平凡之路-kettle使用之hive2连接之前的配置
如果xml文件不全,需要手动去集群下载.这里就不赘述了.


添加hive对应的jar包

在cdh510的lib下添加如下被蓝色框选中的jar包:
笨鸟的平凡之路-kettle使用之hive2连接之前的配置
同样这些jar最好再在⁨kettle⁩/data-integration⁩/lib下再添加一份,并且
kettle⁩/data-integration⁩/lib还需要添加mysql的驱动(红色框选中)
笨鸟的平凡之路-kettle使用之hive2连接之前的配置


可参照如下简书中的步骤操作,但是相应版本有所不同:

https://www.jianshu.com/p/ec45c21a977f

相关文章: