Hive的定义及搭建

1.定义　　

　　Apache Hive数据仓库软件便于读，写和管理大型数据集驻留在分布式存储使用SQL。

　　结构可以投影到存储中的数据上。

　　客户端的连接方式可采用：command line 和 JDBC Driver。

注意：Hive实质就是客户端，不存在主从结构，搭建过程没有集群概念。

2.搭建Hive

　　前提：

　　　　 a.Hadoop集群搭建完成！

　　　　 b.start-dfs.sh 开启HDFS

　　　　　　start-yarn.sh 开启yarn

　　1.安装java

　　2.安装Hadoop

　　3.安装Hive

　　　　a.上传并解压　　

　　　　b.配置环境变量

　　4.开启集群相关服务

　　5.进入Hive

　　　　$>hive

　　6.测试

　　　　hive>show databases;

　　　　hive>use default;

　　　　hive>show tables;

　　　　hive>create table test(id int,name string);

　　　　hive>insert into test values(1,'lisi');

　　　　hive>select * from test;

　　　　hive>drop table test;

3.数据仓库和数据库

　　关系型数据库：OLTP联机事务处理：ACID，实时处理。

　　数据仓库：OLAP联机分析处理：统计，处理和加工（分析操作），离线处理，大数据集。

相关文章：

2021-08-13
2021-12-25
2022-01-25
2022-12-23
2021-06-19
2021-06-03
2021-08-18
2021-12-15

猜你喜欢

2022-01-14
2021-06-13
2021-08-05
2021-11-18
2022-01-03
2021-10-22
2021-05-27

相关资源

下载 2023-01-12
下载 2023-02-01
下载 2022-12-29

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode