1.定义  

  Apache Hive数据仓库软件便于读,写和管理大型数据集驻留在分布式存储使用SQL。

  结构可以投影到存储中的数据上。

  客户端的连接方式可采用:command line 和 JDBC Driver。

注意:Hive实质就是客户端,不存在主从结构,搭建过程没有集群概念。

2.搭建Hive

  前提:

       a.Hadoop集群搭建完成!

       b.start-dfs.sh 开启HDFS

      start-yarn.sh 开启yarn

  1.安装java

  2.安装Hadoop

  3.安装Hive

    a.上传并解压  

    b.配置环境变量

  4.开启集群相关服务

  5.进入Hive

    $>hive

  6.测试

    hive>show databases;

    hive>use default;

    hive>show tables;

    hive>create table test(id int,name string);

    hive>insert into test values(1,'lisi');

    hive>select * from test;

    hive>drop table test;

3.数据仓库和数据库

  关系型数据库:OLTP联机事务处理:ACID,实时处理。

  数据仓库:OLAP联机分析处理:统计,处理和加工(分析操作),离线处理,大数据集。

 

 

 

 

 

 

 

 

 


 

 

相关文章:

  • 2021-08-13
  • 2021-12-25
  • 2022-01-25
  • 2022-12-23
  • 2021-06-19
  • 2021-06-03
  • 2021-08-18
  • 2021-12-15
猜你喜欢
  • 2022-01-14
  • 2021-06-13
  • 2021-08-05
  • 2021-11-18
  • 2022-01-03
  • 2021-10-22
  • 2021-05-27
相关资源
相似解决方案