1.hive中的数据最终是存放在hdfs上的

2.hive本身不是关系型数据库,hive执行sql语句时会把sql语句翻译成mapreduce程序,然后将mapreduce程序提交到hadoop集群中去执行mapreduce程序

3.bin目录下启动hive:./hive后

hive>

hive的使用和深化理解

接下来导入数据

vi emp.txt

hive的使用和深化理解

hive>load data local inpath '/root/emp.txt' into table t_emp;

导入数据以后,可以在/user下看到一个hive目录,因为之前配置好了环境变量,它可以知道Hadoop在哪里,读取Hadoop的配置文件

在HDFS中找目录:/user/hive/warehouse/t_emp,可以找到一个emp.txt文件

所以hive的数据最终在HDFS上

hive>select count(*) from t_emp;

  select count(*) from t_emp where dept_name='销售部' group by dept_name;

  相当于把sql语句转换成mapreduce程序进行执行

  desc t_emp;(可以看到表结构)

 select * from t_emp;(只有查所有数据的时候才不会执行mapreduce,而是将整张表列出来)

 

相关文章:

  • 2021-10-10
  • 2021-09-30
  • 2022-01-30
  • 2022-12-23
  • 2021-05-18
  • 2021-10-22
猜你喜欢
  • 2021-11-30
  • 2021-09-13
  • 2021-11-11
  • 2022-01-19
  • 2021-09-27
  • 2021-09-20
  • 2021-08-23
相关资源
相似解决方案