ETL工具Sqoop使用实验

实验目的:

  1. 掌握ETL工具Sqoop的使用
  2. 掌握MySQL和HDFS之间的数据转换

实验要求:

  1. 掌握ETL工具Sqoop的使用
  2. 能够正常操作数据库、表、数据

实验环境: 

  1. 一台独立PC或虚拟机
  2. 每台主机内存2G以上,磁盘剩余空间500M以上
  3. 已安装CentOS 7.4操作系统
  4. 已安装JDK
  5. 已完成Hadoop平台的搭建
  6. 已完成MYSQL数据库平台的搭建
  7. 已完成HBASE的安装
  8. 已完成hive的安装
  9. 已完成Sqoop工具的安装

一:启动

1,在集群中所有主机上使用命令“zkServer.sh start”启动Zookeeper服务脚本,然后使用命令“zkServer.sh status”查看节点当前状态

ETL工具Sqoop使用-数据共享与整合技术

2.在主节点使用命令“star-all.sh”启动Hadoop集群,在备用主节点使用命令“yarn-daemon.sh start resourcemanmger”启动YARN主节点服务

ETL工具Sqoop使用-数据共享与整合技术

3.确定Hadoop集群启动之后,在主节点输入命令“start-hbase.sh”启动HBASE集群

ETL工具Sqoop使用-数据共享与整合技术

4.进入hive的控制台并查看当前数据库列表

ETL工具Sqoop使用-数据共享与整合技术

5.在主节点验证配置并启动Sqoop服务器

ETL工具Sqoop使用-数据共享与整合技术

6.启动sqoop服务器,使用命令jps查看Java进程(若有名为“SqoopJettyServer”进程则表示sqoop启动成功)

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术

进入Sqoop控制台

ETL工具Sqoop使用-数据共享与整合技术

7.启动MySQL

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术

二、Sqoop工具的使用

(一)MySQL->HDFS

  • MySQL集群使用root用户进行
  • Hadoop、HBASE、hive、Sqoop使用admin用户进行操作

1.初始化Sqoop服务器连接参数

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术2.建立MySQL测试表空间、表和数据

  1. 创建用户Sqoop并授权

ETL工具Sqoop使用-数据共享与整合技术

  1. 创建表空间(schema)Sqoop,并创建测试表

ETL工具Sqoop使用-数据共享与整合技术

  1. 插入测试数据

ETL工具Sqoop使用-数据共享与整合技术

3.建立MySQL数据库连接

  1. 上传
  2. 添加工具包

ETL工具Sqoop使用-数据共享与整合技术

  1. 创建数据库连接

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术

  1. 建立HDFS文件系统连接

ETL工具Sqoop使用-数据共享与整合技术

Create job -f mysql-sqoop -t HDFS-sqoop

ETL工具Sqoop使用-数据共享与整合技术

5.在HDFS创建用于存放导出的数据文件的目录

ETL工具Sqoop使用-数据共享与整合技术

6.创建数据传输事务

ETL工具Sqoop使用-数据共享与整合技术

ETL工具Sqoop使用-数据共享与整合技术

  1. ResourceManager状态查看

ETL工具Sqoop使用-数据共享与整合技术

 

 

相关文章:

  • 2022-12-23
  • 2021-12-08
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-05-05
  • 2022-12-23
  • 2021-08-17
猜你喜欢
  • 2021-09-06
  • 2021-11-25
  • 2021-07-28
  • 2021-04-16
  • 2021-11-30
  • 2021-08-24
相关资源
相似解决方案