1.sqoop介绍

 

Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具来自于Apache软件基金会提供。

Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

Hadoop生态系统包括HDFSHiveHbase等

RDBMS体系包括MysqlOracle、DB2等

Apache Sqoop 的安装(详细!!!适合小白)

 

​​​​​​​2.sqoop安装

安装sqoop的前提是已经具备java和hadoop的环境

首先把下载好的压缩包放入本地的一个路径:

给你们看一下我的:

Apache Sqoop 的安装(详细!!!适合小白)

然后解压:

     tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /export/install/

然后进入到

cd sqoop-1.4.6.bin__hadoop-2.0.4-alpha/conf/

这里面会有很多文件然后将文件名修改一下:

mv sqoop-env-template.sh sqoop-env.sh

vi sqoop-env.sh 进入添加数据

Apache Sqoop 的安装(详细!!!适合小白)

加入mysql的jdbc驱动包:

cp hive-1.1.0-cdh5.14.0/lib/mysql-connector-java-5.1.38.jar /export/install/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/lib

 

验证启动

bin/sqoop list-databases \

 --connect jdbc:mysql://localhost:3306/ \

 --username root --password hadoop(自己的密码!)

相关文章: