项目需求,需要Oracle、Hive之间的数据同步,Kettle连接Hive,坑比较多,Mark下。

一、环境说明

我的大数据集群环境使用的Cloudera,CDH版本为5.14,其他为,

  • kettle的版本是:8.2
  • hadoop:2.6.0
  • hive:1.1

二、Hive配置信息

1、到Cloudera manager界面,选择Hive,下载客户端配置

Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

2、解压配置文件

Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

3、然后将解压的配置文件复制到kettle的安装目录下,我的路径是:D:\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514

Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

三、所需 jar 包

配置文件搞定后,启动报错,还缺两个hadoop的依赖包,hadoop-core.jar和hadoop-common.jar。Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

放上依赖jar后,重启,测试成功。

Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

 

相关文章:

  • 2021-10-16
  • 2021-09-12
  • 2022-12-23
  • 2021-11-26
  • 2022-12-23
  • 2021-12-30
  • 2021-07-11
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-06-18
  • 2021-10-05
  • 2021-11-06
  • 2021-12-18
相关资源
相似解决方案