hive的使用和深化理解

1.hive中的数据最终是存放在hdfs上的

2.hive本身不是关系型数据库，hive执行sql语句时会把sql语句翻译成mapreduce程序，然后将mapreduce程序提交到hadoop集群中去执行mapreduce程序

3.bin目录下启动hive：./hive后

hive>

hive的使用和深化理解

接下来导入数据

vi emp.txt

hive的使用和深化理解

hive>load data local inpath '/root/emp.txt' into table t_emp;

导入数据以后，可以在/user下看到一个hive目录，因为之前配置好了环境变量，它可以知道Hadoop在哪里，读取Hadoop的配置文件

在HDFS中找目录：/user/hive/warehouse/t_emp,可以找到一个emp.txt文件

所以hive的数据最终在HDFS上

hive>select count(*) from t_emp;

　　select count(*) from t_emp where dept_name='销售部' group by dept_name;

　　相当于把sql语句转换成mapreduce程序进行执行

　　desc t_emp;（可以看到表结构）

select * from t_emp;(只有查所有数据的时候才不会执行mapreduce，而是将整张表列出来)