sqoop复习01

  Sqoop是apache旗下一款“hadoop和关系型数据库服务器之间传送数据”的工具。
导入数据:Mysql、Oracle导入数据到Hadoop的HDFS、Hive、Hbase等数据存储系统;
导出数据;从Hadoop的文件系统中导出数据到关系型数据库中

原理:将导入导出命令翻译成mapreduce程序来实现,在翻译出的MapReduce中主要是对inputformat和outputformat进行定制。
sqoop导入:

1、全量导入
1.1、mysql->hdfs
1.2、mysql->hive
1.3、导入表数据子集
2、增量导入
2.1、append模式
2.2、lastmodified模式
2.2.1、append模式
2.2.2、merge-key模式
sqoop复习01

相关文章:

  • 2021-05-09
  • 2022-01-08
  • 2021-12-30
  • 2022-02-02
  • 2021-12-30
猜你喜欢
  • 2021-11-28
  • 2021-08-17
  • 2021-08-18
  • 2021-04-05
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案